


[修订 说明] 


仅仅 为 了 和 营 上 书 苑 制作 ! 

第 一 次 修订 。 改 正 了 文中 的 大 部 分 错别字 和 格式 错误 ， 并 对 一 些 句 
子 依照 中 文 的 习惯 进行 了 改写 。 

[ 译 厅 ] 

那些 自 认 为 已 经 “学 完 ”C 语 言 的 人 ， 请 你 们 仔细 读 阅 读 这 篇 文章 
吧 。 路 还 长 ， 很 多 东西 要 学 。 我 也 是 .…… 

[概述 ] 


C 语 言 像 一 把 雕刻 刀 ， 锋 利 ， 并 且 在 技师 手中 非常 有 用 。 和 任何 锋 
利 的 工具 一 样 ，C 会 伤 到 那些 不 能 掌握 它 的 人 。 本 文 介绍 C 语 言 伤害 粗 
心 的 人 的 方法 ， 以 及 如 何 避 免 伤 害 。 

[内 容 ] 

0 简介 











1 词法 缺陷 


编译 器 的 第 一 个 部 分 常 被 称 为 词法 分 析 嚣 (exical analyzer) 。 词 
法 分 析 器 检查 组 成 程序 的 字符 序列 ， 并 将 它们 划分 为 记号 (token) 一 
个 记号 是 一 个 由 一 个 或 多 个 字符 构成 的 序列 ， 它 在 语言 被 编译 时 具有 一 
个 (相关 地 ) 统一 的 意义 。 在 C 中 ， 例如 ， 记 号 -> 的 意义 和 组 成 它 的 每 
个 独立 的 字符 具有 明显 的 区 别 ， 而 且 其 意义 独立 于 -> 出 现 的 上 下 文 环 
境 。 

另外 一 个 例子 ， 考 虑 下 面 的 语句 : 

if(x > big) big = x; 

该 语句 中 的 每 一 个 分 离 的 字符 都 被 划分 为 一 个 记号 ， 除 了 关键 字 if 
和 标识 符 big 的 两 个 实例 。 

事实 上 ，C 程 序 被 两 次 划分 为 记 和 写 。 首 先是 预 处 理 占 读 取 程序 。 它 
必须 对 程序 进行 记号 划分 以 肥 现 标识 宏 的 标识 符 。 它 必须 通过 对 每 个 宏 
进行 求 值 来 普 换 宏 调 用 。 最 后 ， 经 过 宏 符 换 的 程序 又 被 汇集 成 字符 流 送 
给 编译 器 。 编 译 器 再 第 二 次 将 这 个 流 划 分 为 记号 。 

在 这 一 节 中 ， 我 们 将 探索 对 记 豆 的 意义 的 普 志 的 误解 以 及 记号 和 组 
成 它们 的 字符 之 间 的 关系 。 稍 后 我 们 将 谈 到 预 处 理 器 。 
































1.1 = 不 是 == 


从 Algol 派 生出 来 的 语言 ， 如 Pascal 和 Ada， 用 := 表示 赋值 而 用 = 表示 
比较 。 而 C 语 言 则 是 用 = 表示 赋值 而 用 == 表 示 比 较 。 这 是 因为 赋值 的 频 
率 要 高 于 比较 ， 因 此 为 其 分 配 更 短 的 符号 。 

此 外 ，C 还 将 赋值 视 为 一 个 运算 符 ， 因 此 可 以 很 容易 地 写 出 多 重 赋 
值 ( 如 a=b=c) ， 并 且 可 以 将 赋值 租 入 到 一 个 大 的 表达 式 中 。 

这 种 便捷 导致 了 一 个 潜在 的 问题 ， 可 能 将 需要 比较 的 地 方 写成 赋 
值 。 因 此 ， 下 面 的 语句 好 像 看 起 来 是 要 检查 x 是 否 等 于 y: 

if(x = y) 

foo(); 

而 实际 上 是 将 x 设置 为 y 的 值 并 检查 结果 是 否 非 零 。 再 考虑 下 面 的 一 
个 希望 跳 过 空格 、 制 表 符 和 换行 符 的 循环 : 

while(c ==" "||c="\t || c == ‘\n’) 

c = getc(f); 

FES WHET LER D TET n E REHAR S ==. REE 
较 "实际 上 是 将 \t 赋 给 c， 然 后 判断 c 的 (新 的 ) 值 是 否 为 零 。 因 为 不 为 
零 ， 这 个 “比较 ”将 一 直 为 真 ， 因 此 这 个 循环 会 吃 尽 整 个 文件 。 这 之 后 会 
发 生 什么 取决 于 特定 的 实现 是 否 允 许 一 个 程序 读 取 超过 文件 尾部 的 部 
分 。 如 果 人 允许， 这 个 循环 会 一 直 运 行 。 

一 些 C 编 译 器 会 对 形 如 el = e2 的 条 件 给 出 一 个 警告 以 提醒 用 户 。 当 
你 确实 需要 先 对 一 个 变量 进行 赋值 之 后 再 检查 变量 是 否 非 零 时 ， 为 了 在 
这 种 编译 器 中 避免 警告 信息 ， 应 考虑 显 式 给 出 比较 符 。 换 句 话说 ， 将 : 

if(x = y) 

foo(); 

改写 为 : 

if((x = y) != 0) 

foo(); 

这 样 可 以 清晰 地 表示 你 的 意图 。 















































1.2 & All | ANE && F || 

容易 将 == 错 写 为 = 是 因为 很 多 其 他 语言 使 用 = 表示 比较 运算 。 其 他 
容易 写 错 的 运算 符 还 有 & 和 &&， 以 及 | 和 ||， 这 主要 是 因为 C 语 言 中 的 区 
和 | 运算 符 于 其 他 语言 中 具有 类 似 功能 的 运算 符 大 为 不 同 。 我 们 将 在 第 4 
节 中 贴近 地 观察 这 些 运算 符 。 














1.3 多 字符 记号 

一 些 C 记 守 ， 如 /、* 和 = 只 有 一 个 字符 。 而 其 他 一 些 C 记 号 ， 如 和 
==， 以 及 标识 符 ， 有 具有 多 个 字符 。 当 C 编 译 器 遇 到 紧 连 在 一 起 的 /和 #* 
时 ， 它 必须 能 够 决定 是 将 这 两 个 字符 识别 为 两 个 分 离 的 记号 还 是 一 个 音 
独 的 记号 。C 语 言 参考 手册 说 明了 如 何 决定 :“ 如 果 输 入 流 到 一 个 给 定 的 
字符 串 为 止 已 经 被 识别 为 记号 ， 则 应 该 包含 下 一 个 字符 以 组 成 能 够 构成 
记号 的 最 长 的 字符 串 ”([ 译 注 ] 即 通常 所 说 的 “最 长 子 串 原则 ”) 。 因 此 ， 
如 果 / 是 一 个 记号 的 第 一 个 字符 ， 并 且 / 后 面 紧 随 了 一 个 *， 则 这 两 个 字符 
构成 了 注释 的 开始 ， 不 管 其 他 上 下 文 环 境 。 

下 面 的 语句 看 起 来 像 是 将 y 的 值 设 置 为 x 的 值 除 以 p 所 指 癌 的 值 : 

y = x/*p /* p 指 癌 除数 */; 

实际 上 ，# 开 始 了 一 个 注释 ， 因 此 编译 器 简单 地 吞噬 程序 文本 ， 直 
到 ”的 出 现 。 换 名 话说， 这 条 语句 仅仅 把 y 的 值 设 置 为 x 的 值 ， 而 根本 没 
有 看 到 p。 将 这 条 语句 重 写 为 : 

y=x/*p/* p 指 同 除数 */; 

或 者 干脆 是 

y =x / (*p) /* pfs RAL */; 

Et AY DARE RET HAR AIRIA T o 

KPR A AY EN S AEREA PS S| ERI. Aa, EE 
C 使 用 =+ 表 示 现 在 版 本 中 的 +=。 这 样 的 编译 器 会 将 

a=-1; 

视 为 

a=- 1; 

成 

a=a-1; 

这 会 让 打算 写 

a=-l; 

的 程序 员 感 到 吃惊 。 男 一 方面 ， 这 种 老 版 本 的 C 编 译 器 会 将 

a=/*b; 

WT AY AY 























a =/ *b; 
尽管 /#* 看 起 来 像 一 个 注释 。 





1.4 例外 


组 合 赋值 运算 符 如 += 实 际 上 是 两 个 记号 。 因 此 ， 

a+ /* strange */ = 1 

和 

at=1 

是 一 个 意思 。 看 起 来 像 一 个 单独 的 记号 而 实际 上 是 多 个 记号 的 只 有 
这 一 个 特例 。 特 别 地 ， 

p-7a 

是 不 合法 的 。 它 和 

p-7a 

不 是 同义词 。 

另 一 方面 ， 有 些 老式 编译 器 还 是 将 =+ 视 为 一 个 单独 的 记号 并 且 和 
+= 是 同义词 。 














1.5 字符 串 和 字符 


单 引号 和 双 引 号 在 C 中 的 意义 完全 不 同 ， 在 一 些 混 乱 的 上 下 文中 它 
们 会 导致 奇怪 的 结果 而 不 是 错误 消息 。 

包围 在 单 引 号 中 的 一 个 字符 只 是 编写 整数 的 男 一 种 方法 。 这 个 整数 
是 给 定 的 字符 在 实现 的 对 照 序 列 中 的 一 个 对 应 的 值 。 因 此 ， 在 一 个 
ASCII 实 现 中 ，'a 和 0141 或 97 表 示 完 全 相同 的 东西 。 而 一 个 包围 在 双 引 
写 中 的 字符 串 ， 只 是 编写 一 个 有 双 引 号 之 间 的 字符 和 一 个 附加 的 三 进 制 
值 为 零 的 字符 所 初始 化 的 一 个 无 名 数组 的 指针 的 一 种 简短 方法 。 

下 面 的 两 个 程序 片断 是 等 价 的 : 

printf(" Hello world\n"); 

char hello[] = { 'H', 'e', T, T, '0', "', 'w’, '0', 'r’, T, 'd', \n', O }; 

printf(hello); 

使 用 一 个 指针 来 代替 一 个 整数 通常 会 得 到 一 个 警告 消息 (反之 亦 
然 ) ， 使 用 双 引 号 来 代 玲 单 引 号 也 会 得 到 一 个 警告 消 轧 《反之 亦 然 ) 。 
但 对 于 不 检查 参数 类 型 的 编译 器 却 除外 。 因 此 ， 用 

printf(‘\n'); 

RRE 

printf("\n"); 

通常 会 在 运行 时 得 到 奇怪 的 结果 。 ÆR: Ea Em 
说 ，"\n' 表 示 一 个 整数 ， 它 被 转换 为 了 一 个 指针 ， 这 个 指针 所 指 癌 的 内 容 
是 没有 意义 的 。) 

由 于 一 个 整数 通常 足够 大 ， 以 至 于 能 够 放下 多 个 字符 ， 一 些 C 编 译 
器 允许 在 一 个 字符 常量 中 存放 多 个 字符 。 这 意味 着 用 yes' 代 蔡 "yes" 将 不 
会 被 发 现 。 后 者 意味 着 “分 别 包含 y、e、s 和 一 个 空 字符 的 四 个 连续 存储 
器 区 域 中 的 第 一 个 的 地 址 ”， 而 前 者 意味 着 “在 一 些 实现 定义 的 样式 中 表 
示 由 字符 y、e、s 联 合 构 成 的 一 个 整数 "。 这 两 者 之 间 的 任何 一 致 性 都 纯 
属 巧 合 。 















































2 句法 缺陷 
要 理解 C 语 言 程 序 ， 仪 了 解构 成 它 的 记号 是 不 够 的 。 还 要 理解 这 些 
记号 是 如 何 构成 声明 、 表 达 式 、 语 句 和 程序 的 。 尽 管 这 些 构成 通常 都 是 
定义 良好 的 ， 但 这 些 定 义 有 时 候 是 有 悖 于 直觉 的 或 混乱 的 。 
在 这 一 节 中 ， 我 们 将 着 眼 于 一 些 不 明显 句法 构造 。 








2.1 理解 声明 


我 曾经 和 一 些 人 聊 过 天 ， 他 们 那 时 正在 在 编写 在 一 个 小 型 的 微 处 理 
器 上 单机 运行 的 C 程 序 。 当 这 台 机 器 的 开关 打开 的 时 候 ， 硬 件 会 调用 地 
址 为 0 处 的 子 程序 。 

为 了 模仿 电源 打开 的 情形 ， 我 们 要 设计 一 条 C 语 句 来 显 式 地 调用 这 
个 子 程序 :经 过 一 些 思 考 ， 我 们 号 出 了 下 面 的 语句 : 

(*(void(*)Q)0)0; 

这 样 的 表达 式 会 令 C 程 序 员 心 惊 胆 战 。 但 是 ， 并 不 需要 这 样 ， 因 为 
他 们 可 以 在 一 个 简单 的 规则 的 帮助 下 很 容易 地 构造 它 :; 以 你 使 用 的 方式 
声明 它 。 

每 个 C 变 量 声明 都 具有 两 个 部 分 : 一 个 类 型 和 一 组 具有 特定 格式 
的 、 期 望 用 来 对 该 类 型 求 值 的 表达 式 。 最 简单 的 表达 式 束 是 一 个 变量 : 

float f, g; 

说 明 表 达 式 f 和 g 一 一 在 求 值 的 时 候 一 一 具有 类 型 float。 由 于 待 求 值 
的 是 表达 式 ， 因 此 可 以 自由 地 使 用 圆 括号 : 
float ((f)); 
这 表示 ((f) 求 值 为 float 并 且 因 此 ， 通 过 推 新 ，{f 也 是 一 个 float。 
同样 的 逻辑 用 在 函数 和 指针 类 型 。 例 如 : 
float ff(); 
表示 表达 式 ff0) 是 一 个 float， 因 此 ff 是 一 个 返回 一 个 float 的 函数 。 类 











似 地 

float *pf; 

表示 *pf 是 一 个 float 并 且 因 此 pf 是 一 个 指 癌 一 个 float 的 指针 。 

这 些 形式 的 组 合 声明 对 表达 式 是 一 样 的 。 因 此 ， 

float *g(), (*h)Q; 

表示 *gO0 和 (*h)O 都 是 float 表 达 式 。 由 于 0 比 * 绑 定 得 更 紧密 ，*g0 和 * 
(gO) 表 示 同 样 的 东西 : g 是 一 个 返回 指 float 指 针 的 函数 ， 而 h 是 一 个 指 癌 
返回 float 的 函数 的 指针 。 

当 我 们 知道 如 何 声明 一 个 给 定 类 型 的 变量 以 后 ， 就 能 够 很 容易 地 写 
出 一 个 类 型 的 模型 (cast) : 只 要 删除 变量 名 和 分 号 并 将 所 有 的 东西 包 


围 在 一 对 圆 括 号 中 即 可 。 因 此 ， 由 于 

float *g(); 

声明 g 是 一 个 返回 float 指 针 的 函数 ， 所 以 (float *0) 就 是 它 的 模型 。 

有 了 这 些 知识 的 武装 ， 我 们 现在 可 以 准备 解决 (*(void(*)0)0)0 了 。 
我 们 可 以 将 它 分 为 两 个 部 分 进行 分 析 。 首 先 ， 假 设 我 们 有 一 个 变量 fp， 
它 包含 了 一 个 函数 指针 ， 并 且 我 们 希望 调用 二 所 指 同 的 函数 。 可 以 这 样 
写 : 

(*fp)O; 

QO Ripxe— A RARE MWp ee es A, AUC ipoe 
调用 它 的 一 种 方法 。(*fp) 中 的 括号 是 必须 的 ， 否 则 这 个 表达 式 将 会 被 分 
析 为 *(fpO)。 我 们 现在 要 找 一 个 适当 的 表达 式 来 奉 换 fp。 

这 个 问题 就 是 我 们 的 第 二 步 分 析 。 如 果 C 可 以 读 入 并 理解 类 型 ， 我 
们 可 以 写 : 

(*0)0; 

但 这 样 并 不 行 ， 因 为 * 运 算 符 要 求 必须 有 一 个 指针 作为 它 的 操作 
数 。 男 外 ， 这 个 操作 数 必 须 是 一 个 指 回 函数 的 指针 ， 以 保证 * 的 结果 可 
以 被 调用 。 因 此 ， 我 们 需要 将 0 转换 为 一 个 可 以 描述 * 指 同一 个 返回 void 
的 函数 的 指针 ”的 类 型 。 

如 果 印 是 一 个 指 同 返回 void 的 函数 的 指针 ， 则 (*fp)O0 是 一 个 void 值 ， 
并 且 它 的 声明 将 会 是 这 样 的 : 

void (*fp)Q; 

因此 ， 我 们 需要 写 : 

void (*fp)Q; 

(*fp)O; 

ORS HAS ees, BSR AE Y a eee, BT te 
道 了 如 何 将 一 个 常数 转换 为 该 类 型 REM A A PR He BY 
T E ONES Clearer peer anes 








(void(*)Q)0 

FE RK, FATA woid(*)()OK 4 fp: 
(*(void(*)())0)0; 

结尾 处 的 分 号 用 于 将 这 个 表达 式 转 换 为 一 个 语句 。 


在 这 里 ， 我 们 解决 这 个 问题 时 没有 使 用 typedef 声 明 。 通 过 使 用 它 ， 
我 们 可 以 更 清晰 地 解决 这 个 问题 : 

typedef void (*funcptr)(); 

(*(funcptr)0)(); 





2.2 运算 符 并 不 总 是 具有 你 所 想象 的 优先 级 


假设 有 一 个 声明 了 的 常量 FLAG， 它 是 一 个 整数 ， 其 二 进 制 表示 中 
的 某 一 位 被 置 位 〈 换 名 话说 ， 它 是 2 的 某 次 时 ) ， 并 且 你 希望 测试 一 个 
整 型 变量 flags 该 位 是 否 被 置 位 。 通 常 的 写法 是 : 

if(flags & FLAG)... 

其 意义 对 于 很 多 C 程 序 员 都 是 很 明确 的 : 让 语句 测试 括号 中 的 表达 
式 求 值 的 结果 是 否 为 0。 出 于 清晰 的 目的 我 们 可 以 将 它 写 得 更 明确 : 

if(flags & FLAG != 0)... 

这 个 语句 现在 更 容易 理解 了 。 但 它 仍 然 是 错 的， 因为 != 比 & 绑 定 得 
更 紧密 ， 因 此 它 被 分 析 为 : 

if(flags & (FLAG != 0))... 

这 《偶尔 ) 是 可 以 的 ， 如 FLAG 是 1 或 0〈! ) 的 时 候 ， 但 对 于 其 他 2 
的 需 是 不 行 的 [2]。 

假设 你 有 两 个 整 型 变量 ，h 和 1， 它 们 的 值 在 0 和 15〈 含 0 和 15) 之 
间 ， 并 且 你 硕 望 将 r 设 置 为 8 位 值 ， 其 低位 为 ]， 高 位 为 hn。 一 种 上 自然 的 写 
法 是 : 

r=h<<4+1; 

不 幸 的 是 ， 这 是 错误 的 。 加 法 比 移 位 绑 定 得 更 紧密 ， 因 此 这 个 例子 
等 价 于 ; 

r=h<<(4+)); 

正确 的 方法 有 两 种 : 

r=(h<<4)+] 

T=h<<4|1 

避免 这 种 问题 的 一 个 方法 是 将 所 有 的 东西 都 用 括号 括 起 来 ， 但 表达 
式 中 的 括号 过 度 就 会 难以 理解 ， 因 此 最 好 还 是 是 记 住 C 中 的 优先 级 。 

不 幸 的 是 ， 这 有 15 个 ， 太 困难 了 。 然 而 ， 通 过 将 它们 分 组 可 以 变 得 
容易 。 

绑 定 得 最 紧密 的 运算 符 并 不 是 真正 的 运算 符 : 下 标 、 函 数 调用 和 结 
构 选择 。 这 些 都 与 左边 相关 联 。 

接 下 来 是 一 元 运算 符 。 它 们 具有 真正 的 运算 符 中 的 最 高 优先 级 。 由 


















































于 函数 调用 比 一 元 运算 符 绑 定 得 更 紧密 ， 你 必须 写 (*p)0 来 调用 p 指 辐 的 
函数 ，*p0 表 示 p 是 一 个 返回 一 个 指针 的 函数 。 转 换 是 一 元 运算 符 ， 并 且 
和 其 他 一 元 运算 符 有 具有 相同 的 优先 级 。 一 元 运算 符 是 右 结合 的 ， 因 此 
*p++ 表 不 *(p++)， 而 个 是 (*p)++。 

在 接 下 来 是 真正 的 二 元 运算 符 。 其 中 数学 运算 符 具 有 最 高 的 优先 
级 ， 然 后 是 移 位 运算 符 、 关 系 运算 符 、 膛 辑 运算 符 、 赋 值 运算 符 ， 最 后 
是 条 件 运算 符 。 需 要 记 住 的 两 个 重要 的 东西 是 : 

所 有 的 逻辑 运算 符 有 共有 比 所 有 关系 运算 符 都 低 的 优先 级 。 

移 位 运算 符 比 关系 运算 符 绑 定 得 更 紧密 ， 但 又 不 如 数学 运算 符 。 

在 这 些 运算 符 类 别 中 ， 有 一 些 奇怪 的 地 方 。 乘 法 、 除 法 和 求 余 具有 
相同 的 优先 级 ， 加 法 和 减法 具有 相同 的 优先 级 ， 以 及 移 位 运算 符 具 有 相 
同 的 优先 级 。 

还 有 束 是 六 个 关系 运算 符 并 不 具有 相同 的 优先 级 : == 和 != 的 优先 级 
比 其 他 关系 运算 符 要 低 。 这 就 允许 我 们 判断 a 和 b 是 否 上 共有 与 c 和 d 相 同 的 
顺序 ， 例 如 : 

a<b==c<d 

在 逻辑 运算 符 中 ， 没 有 任何 两 个 具有 相同 的 优先 级 。 按 位 运算 符 比 
所 有 顺序 运算 符 绑 定 得 都 紧密 ， 每 种 与 运算 符 都 比 相应 的 或 运算 符 绑 定 
得 更 紧密 ， 并 且 按 位 异 或 〈^A) 运算 符 介 于 按 位 与 和 按 位 或 之 间 。 

三 元 运算 符 的 优先 级 比 我 们 提 到 过 的 所 有 运算 符 的 优先 级 都 低 。 这 
可 以 保证 选择 表达 式 中 包含 的 关系 运算 符 的 逻辑 组 合 特性 ， 如 : 

z=a<b&&b<c?d:e 

这 个 例子 还 说 明了 赋值 运算 符 具 有 比 条 件 运算 符 更 低 的 优先 级 是 有 
意义 的 。 另 外 ， 所 有 的 复合 赋值 运算 符 具 有 相同 的 优先 级 并 且 是 目 右 至 
左 结 合 的 ， 因 此 

a=b=c 

和 

b=c;a=b; 

是 等 价 的 。 

具有 最 低 优 先 级 的 是 逗号 运算 符 。 这 很 容易 理解 ， 因 为 逗号 通常 在 
需要 表达 式 而 不 是 语句 的 时 候 用 来 蔡 代 分 号 。 

赋值 是 另 一 种 运算 符 ， 通 党 具有 混合 的 优先 级 。 例 如 ， 考 虑 下 面 这 

































































个 用 于 复制 文件 的 循环 : 

while(c = getc(in) != EOF) 

putc(c, out); 

这 个 while 循 环 中 的 表达 式 看 起 来 像 是 c 被 赋 以 getc(imD) 的 值 ， 接 下 来 
判断 是 否 等 于 EOF 以 结束 循环 。 不 笠 的 是 ， 赋 值 的 优先 级 比 任何 比较 操 
作 都 低 ， 因 此 c 的 值 将 会 是 getc(in) 和 EOF 比 较 的 结果 ， 并 且 会 被 抛弃 。 
因此 ,“ 复 制 * 得 到 的 文件 将 是 一 个 由 值 为 1 的 字 市 流 组 成 的 文件 。 

上 面 这 个 例子 正确 的 写法 并 不 难 : 

while((c = getc(in)) != EOF) 

putc(c, out); 

然而 ， 这 种 错误 在 很 多 复杂 的 表达 式 中 却 很 难 被 发 现 。 例 如 ， 随 
UNIX 系 统一 同 发布 的 lint 程 序 通 常 带 有 下 面 的 错误 行 : 

if (((t = BTYPE(pt1->aty) == STRTY) || t == UNIONTY) { 

这 条 语句 希望 给 {周一 个 值 ， 然 后 看 t 是 人 否 与 STRTY 或 UNIONTY 相 
等 。 而 实际 的 效果 却 大 不 相同 [3]。 

C 中 的 逻辑 运算 符 的 优先 级 具有 历史 原因 。B 语 言 一 一 C 的 前 面 
具有 和 C 中 的 & 和 | 运算 符 对 应 的 逻辑 运算 符 。 尽 管 它们 的 定义 是 按 位 的 
， 但 编译 器 在 条 件 判 断 上 下 文中 将 它们 视 为 和 && 和 | 一 样 。 当 在 C 中 将 
它们 分 开 后 ， 优 先 级 的 改变 是 很 危险 的 [和 4。 














2.3 看 看 这 些 分 号 ! 

C 中 的 一 个 多 余 的 分 号 通常 会 带 来 一 点 点 不 同 ; 或 者 是 一 个 空 语 
句 ， 无 任何 效果 ; 或 者 编译 器 可 能 提出 一 个 诊断 消 恩 ， 可 以 方便 除去 挥 
它 。 一 个 重要 的 区 别 是 在 必须 跟 有 一 个 语句 的 过 和 while 语 名 中。 考虑 下 
面 的 例子 : 

if(x > big); 

big = x; 

这 不 会 发 生 编 译 错误 ， 但 这 段 程序 的 意义 与 : 

if(x > big) 

big = x; 

就 大 不 相同 了 。 第 一 个 程序 段 等 价 于 : 

if(x > big) { } 

big = x; 

也 就 是 等 价 于 : 

big = x; 

(除非 x、i 或 big 是 市 有 副作用 的 宏 〉》。 

另 一 个 因 分 号 引起 巨大 不 同 的 地 方 是 函数 定义 前 面 的 结构 声明 的 末 
尾 〔[ 译 注 ] 这 人 句 话 不 太 好 听 ， 看 例子 就 明日 7 了)〉。 考 虑 下 面 的 程序 片 


段 : 














struct foo { 

int x; 

} 

fO í 

} 

在 紧 挨 着 的 第 一 个 } 后 面 于 失 了 一 个 分 号 。 它 的 效果 是 声明 了 一 个 


函数 A 返回 值 类 型 是 struct fjoo， 这 个 结构 成 了 函数 声明 的 一 部 分 。 如 果 
这 里 出 现 了 分 号 ， 则 人/ 将 被 定义 为 具有 默认 的 整 型 返回 值 后 )。 














2.4 switch 语 人 句 


通常 C 中 的 switch 语 句 中 的 case 段 可 以 进入 下 一 个 。 例如， 考虑 下 面 
的 C 和 Pascal 程 序 片 断 : 


switch(color) { 

case 1: printf ("red"); 

break; 

case 2: printf ("yellow"); 

break; 

case 3: printf ("blue"); 

break; 

} 

case color of 

1: write (‘red’); 

2: write (‘yellow’); 

3: write (‘blue’); 

end 

这 两 个 程序 片段 都 作 相 同 的 事情 : 根据 变量 color 的 值 是 1、2 还 是 3 
打印 red、yellow 或 blue〈 没 有 新 行 符 ) 。 这 两 个 程序 片段 非常 相似 ， 只 
有 一 点 不 同 : Pascal 程 序 中 没有 C 中 相应 的 break 语 句 。C 中 的 case 标 签 是 
真正 的 标签 : 控制 流程 可 以 无 限制 地 进入 到 一 个 case 标 签 中 。 

看 看 男 一 种 形式 ， 假 设 C 程 序 段 看 起 来 更 像 Pascal: 


switch(color) { 





case 1: printf ("red"); 
case 2: printf ("yellow"); 
case 3: printf ("blue"); 

} 


并 且 假 设 color 的 值 是 2-。 则 该 程序 将 打印 yellowblue， 因 为 控制 自然 
地 转 入 到 下 一 个 printfO 的 调用 。 


这 既是 C 语 言 switch 语 句 的 优点 又 是 它 的 弱点 。 说 它 是 弱点 ， 是 因 
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它 是 优点 ， 是 因为 通过 故意 去 掉 break 语 句 ， 可 以 很 容易 实现 其 他 方法 
难以 实现 的 控制 结构 。 尤 其 是 在 一 个 大 型 的 Switch 语句 中 ， 我 们 经 党 发 
现 对 一 个 case 的 处 理 可 以 简化 其 他 一 些 特殊 的 处 理 。 

例如 ， 设 想 有 一 个 程序 是 一 台 假 想 的 机 器 的 翻译 器 。 这 样 的 一 个 程 
序 可 能 包含 一 个 switch 语 句 来 处 理 各 种 操作 码 。 在 这 样 一 台 机 器 上 ， 通 
常 减法 在 对 其 第 二 个 运算 数 进行 变 号 后 就 变 成 和 加 法 一 样 了 。 因 此 ， 最 
好 可 以 写 出 这 样 的 语句 : 

case SUBTRACT: 

opnd2 = -opnd2; 

/* no break; */ 

case ADD: 




















男 外 一 个 例子 ， 考 虑 编译 器 通过 跳 过 空白 字符 来 查找 一 个 记 写 。 这 
里 ， 我 们 将 空格 、 制 表 符 和 新 行 符 视 为 是 相同 的 ， 除 了 新 行 符 还 要 引起 
行 计 数 器 的 增长 外 : 


case \n 








linecount++; 
/* no break */ 
case ‘\t': 


case '': 


2.5 函数 调用 
和 其 他 程序 设计 语言 不 同 ，C 要 求 一 个 函数 调用 必须 有 一 个 参数 列 
， 但 可 以 没有 参数 。 因 此 ， 如 果 f 是 一 个 函数 ， 
f0; 
就 是 对 该 函数 进行 调用 的 语句 ， 而 
f; 
什么 也 不 做 。 它 会 作为 函数 地 址 被 求 值 ， 但 不 会 调用 它 [6]。 


2.6 悬挂 else 问 题 


在 讨论 任何 语法 缺陷 时 我 们 都 不 会 巧 记 提 到 这 个 问题 。 尺 管 这 一 问 
题 不 是 C 语 言 所 独 有 的 ， 但 它 仍 然 伤 害 着 那些 有 着 多 年 经 验 的 C 程 序 











To 
考虑 下 面 的 程序 片断 : 
if(x == 0) 
if(y == 0) error(); 
else { 
Z=xty; 
f(&z); 
} 


写 这 段 程序 的 程序 员 的 目的 明显 是 将 情况 分 为 两 种 : x = 0 和 x I= 
0。 在 第 一 种 情况 中 ， 程 序 段 什 么 都 不 做 ， 除 非 y = 0 时 调用 error()。 第 二 
种 情况 中 ， 程 序 设置 z = x+y 并 以 z 的 地 址 作为 参数 调用 f()。 

然而 ， 这 上段 程序 的 实际 效果 却 大 为 不 同 。 其 原因 是 一 个 else 总 是 与 
其 最 近 的 让 相 关联 。 如 采 我 们 希望 这 段 程序 能 够 按照 实际 的 情况 运行 ， 
应 该 这 样 写 : 

if(x == 0) { 

if(y == 0) 

error(); 

else { 

Z=xt+y; 

f(&z); 

} 

} 

换 句 话说 ， 当 x != 0 发 生 时 什么 也 不 做 。 如 果 要 达到 第 一 个 例子 的 
效果 ， 应 该 写 : 


error(); 

} 

else { 

Le FEY 
{(&z); 

} 


3 连接 


—AS CREPE AY BEA AR & BB oy ZA, EAT oT a PE, HEE Sa 
PRA ERE at. EPCS BE a BIA a AY FE BB EB] — ES. Lh FE UR 
通 第 只 能 看 到 一 个 文件 ， 因 此 它 无 法 检测 到 需要 程序 的 多 个 源 文件 的 内 


容 才 能 发 现 的 错误 。 

在 这 一 节 中 ， 我 们 将 看 到 一 些 这 种 类 型 的 错误 。 有 一 些 C 实 现 ， 但 
不 是 所 有 的 ， 带 有 一 个 称 为 lint 的 程序 来 捕获 这 些 错误 。 如 果 具 有 一 个 
这 样 的 程序 ， 那 么 无 论 怎样 地 强调 它 的 重要 性 都 不 过 分 。 














3.1 你 必须 自己 检查 外 部 类 型 
假设 你 有 一 个 C 程 序 ， 被 划分 为 两 个 文件 。 其 中 一 个 包含 如 下 声 


HH: 
int n; 
而 令 一 个 包含 如 下 声明 : 
long n; 


这 不 是 一 个 有 效 的 C 程 序 ， 因 为 一 些 外 部 名 称 在 两 个 文件 中 被 声明 
为 不 同 的 类 型 。 然 而 ， 很 多 实现 检测 不 到 这 个 错误 ， 因 为 编译 器 在 编译 
其 中 一 个 文件 时 并 不 知道 另 一 个 文件 的 内 容 。 因 此 ， 检 查 类 型 的 工作 只 
能 由 连接 器 《或 一 些 工具 程序 如 lint) 来 完成 ， 如 果 操 作 系统 的 连接 器 
不 能 识别 数据 类 型 ，C 编 译 器 也 没 法 过 多 地 强制 它 。 

那么 ， 这 个 程序 运行 时 实际 会 发 生 什么 ? 这 有 很 多 可 能 性 ; 

实现 足够 聪明 ， 能 够 检测 到 类 型 冲突 。 则 我 们 会 得 到 一 个 诊断 消 
息 ， 说 明 n 在 两 个 文件 中 具有 不 同 的 类 型 。 

你 所 使 用 的 实现 将 int 和 long 视 为 相同 的 类 型 。 典 型 的 情况 是 机 器 可 
以 自然 地 进行 32 位 运算 。 在 这 种 情况 下 你 的 程序 或 许 能 够 工作 ， 好 象 你 
两 次 都 将 变量 声明 为 long (或 int) 。 但 这 种 程序 的 工作 纯 属 偶然 

n 的 两 个 实例 需要 不 同 的 存储 ， 它 们 以 某 种 方式 共享 存储 区 ， 即 对 
其 中 一 个 的 赋值 对 另 一 个 也 有 效 。 这 可 能 发 生 ， 例 如 ， 编 译 器 可 以 将 int 
安排 在 long 的 低位 。 不 论 这 是 基于 系统 的 还 是 基于 机 器 的 ， 这 种 程序 的 
运行 同样 是 偶然 

n 的 两 个 实例 以 另 一 种 方式 共享 存储 区 ， 即 对 其 中 一 个 赋值 的 效果 
是 对 另 一 个 赋 以 不 同 的 值 。 在 这 种 情况 下 ， 程 序 可 能 失败 。 

这 种 情况 发 生 的 里 一 个 例子 出 奇 地 频繁 。 程 序 的 某 一 个 文件 包含 下 
面 的 声明 








char filename[] = "etc/passwd"; 

而 男 一 个 文件 包含 这 样 的 声明 : 

char *filename; 

尽管 在 某 些 环境 中 数组 和 指针 的 行为 非常 相似 ， 但 它们 是 不 同 的 。 
在 第 一 个 声明 中 ，filename 是 一 个 字符 数组 的 名 字 。 尽 管 使 用 数组 的 名 
字 可 以 产生 数组 第 一 个 元 素 的 指针 ， 但 这 个 指针 只 有 在 需要 的 时 候 才 产 





生 并 且 不 会 持续 。 在 第 二 个 声明 中 ，filename 是 一 个 指针 的 名 字 。 这 个 
间 针 可 以 指向 程序 员 让 它 指 癌 的 任何 地 方 。 如 果 程 序 员 没 有 给 它 赋 一 个 
值 ， 它 将 具有 一 个 默认 的 0 值 (NULL) ([ 译 注 ] 实 际 上 ， 在 C 中 一 个 为 
初始 化 的 指针 通常 具有 一 个 随机 的 值 ， 这 是 很 危险 的 ! ) 。 

这 两 个 声明 以 不 同 的 方式 使 用 存储 区 ， 它 们 不 可 能 共存 。 

避免 这 种 类 型 冲突 的 一 个 方法 是 使 用 像 lint 这 样 的 工具 (如 果 可 以 
的 话 ) 。 为 了 在 一 个 程序 的 不 同 编译 单元 之 间 检 查 类 型 冲突 ， 一 些 程序 
需要 一 次 看 到 其 所 有 部 分 。 典 型 的 编译 器 无 法 完成 ， 但 lint 可 以 。 

避免 该 问题 的 另 一 种 方法 是 将 外 部 声明 放 到 包含 文件 中 。 这 时 ， 一 
个 外 部 对 象 的 类 型 仅 出 现 一 次 [7]。 














4 语义 缺陷 


一 个 句子 可 以 是 精确 拼写 的 并 且 没 有 语法 错误 ， 但 仍然 没有 意义 。 
在 这 一 市 中 ， 我 们 将 会 看 到 一 些 程序 的 写法 会 使 得 它们 看 起 来 是 一 个 意 
思 ， 但 实际 上 是 为 一 种 完全 不 同 的 意思 。 

我 们 还 要 讨论 一 些 表 面 上 看 起 来 合理 但 实际 上 会 产生 未 定义 结果 的 
环境 。 我 们 这 里 讨论 的 东西 并 不 保证 能 够 在 所 有 的 C 实 现 中 工作 。 我 们 
暂且 怎 记 这 些 能 够 在 一 些 实现 中 工作 但 可 能 不 能 在 为 一 些 实现 中 工作 的 
东西 ， 直 到 第 7 节 讨 论 可 以 执行 问题 为 止 。 


























4.1 表达 式 求 值 顺 序 


一 些 C 运 算 符 以 一 种 已 知 的 、 特 定 的 顺序 对 其 操作 数 进行 求 值 。 但 
为 一 些 不 能 。 例 如 ， 考 上 处 下 面 的 表达 式 : 

a<b&&c<d 

C 语 言 定义 规定 a < b 首 先 被 求 值 。 如 果 a 确 实 小 于 b，c < d 必 须 紧 接 
着 被 求 值 以 计算 整个 表达 式 的 值 。 但 如 果 a 大 于 或 等 于 b， 则 c < d 根 本 不 
会 被 求 值 。 

要 对 a < b 求 值 ， 编 译 器 对 a 和 b 的 求 值 就 会 有 一 个 先后 。 但 在 一 些 机 
嚣 上， 它们 也 许 是 并 行进 行 的 。 

Cc 中 只 有 四 个 运算 符 &&、|、?: 和 ,指定 了 求 值 顺序 。&& 和 || 最 先 对 
左边 的 操作 数 进行 求 值 ， 而 右边 的 操作 数 只 有 在 需要 的 时 候 才 进行 求 
值 。 而 ?: 运 算 符 中 的 三 个 操作 数 : a、b 和 c， 最 先 对 a 进 行 求 值 ， 之 后 仅 
对 b 或 c 中 的 一 个 进行 求 值 ， 这 取决 于 a 的 值 。, 运 算 符 首先 对 左边 的 操作 
数 进行 求 值 ， 然 后 抛弃 它 的 值 ， 对 右边 的 操作 数 进行 求 值 [8]。 

C 中 所 有 其 它 的 运算 符 对 操作 数 的 求 值 顺序 都 是 未 定义 的 。 事 实 
上 ， 赋 值 运 算 符 不 对 求 值 顺序 做 出 任何 保证 。 

出 于 这 个 原因 ， 下 面 这 种 将 数组 x 中 的 前 n 个 元 素 复制 到 数组 y 中 的 
方法 是 不 可 行 的 : 

i= 0; 

while(i < n) 

y= x[it+]; 

其 中 的 问题 是 y 的 地 址 并 不 保证 在 i 增长 之 前 被 求 值 。 在 某 些 实现 
中 ， 这 是 可 能 的 ;但 在 另 一 些 实现 中 却 不 可 能 。 另 一 种 情况 出 于 同样 的 
原因 会 失败 : 

i = 0; 

while(i < n) 

ylit++] =x; 

而 下 面 的 代码 是 可 以 工作 的 : 

i = 0; 

while(i < n) { 














y=x; 

LFE; 

} 

=, BARS A: 
for(i = 0; i <n; i++) 


y=X 


4.2 &&、|| 和 ! 运 算 符 

C 中 有 两 种 逻辑 运算 符 ， 在 某 些 情况 下 是 可 以 交换 的 : 按 位 运算 符 
&、| 和 ~， 以 及 逻辑 运算 符 &&、|| 和 !。 一 个 程序 员 如 果 用 某 一 类 运算 符 
替换 相应 的 另 一 类 运算 符 会 得 到 某 些 奇怪 的 效果 : 程序 可 能 会 正确 地 工 
作 ， 但 这 纯 属 偶然 。 

&&、|| 和 ! 运 算 符 将 它们 的 参数 视 为 仅 有 “ 真 ?或 “ 假 ?， 通 和 约定 0 代 
表 “ 假 ?而 其 它 的 任意 值 都 代表 “ 真 ”。 这 些 运算 符 返 回 1 表示 “ 真 ” 而 返回 0 
HANA’, 而且 && 和 | 运算 符 当 可 以 通过 左边 的 操作 数 确 定 其 返回 值 
时 ， 就 不 会 对 右边 的 操作 数 进行 求 值 。 

因此 !10 是 零 ， 因 为 10 非 零 ，10 && 12 是 1， 因 为 10 和 12 都 非 零 ，10 
| 12 也 是 1， 因 为 10 非 零 。 另 外 ， 最 后 一 个 表达 式 中 的 12 不 会 被 求 值 ，10 
上 1f0 中 的 {0 也 不 会 被 求 值 。 

考虑 下 面 这 段 用 于 在 一 个 表 中 查找 一 个 特定 元 素 的 程序 : 

i=0; 

while(i < tabsize && tab != x) 











Itti 

这 段 循 环 背 后 的 意思 是 如 果 ;i 等 于 tabsize 时 循环 结束 ， 元 素 未 被 找 
4. Al, iS TRNAS. 

假设 这 个 例子 中 的 && 不 小 心 被 蔡 换 为 了 &， 这 个 循环 可 能 仍然 能 
够 工作 ， 但 只 有 两 种 竺 运 的 情况 可 以 使 它 停 下 来 。 

首先 ， 这 两 个 操作 都 是 当 条 件 为 假 时 返回 0， 当 条 件 为 真 时 返回 1。 
只 要 x 和 y 都 是 1 或 0，x & y 和 x && y 都 具有 相同 的 值 。 然 而 ， 如 果 当 使 用 
eer tere mee 了 这 两 个 运算 符 ， 这 个 循环 将 不 会 
工作 。 

其 次 ， 由 于 数组 元 素 不 会 改变 ， 因 此 越过 数组 最 后 一 个 元 素 前 进 一 
个 位 置 时 是 无 害 的 ， 循 环 会 幸运 地 停 下 来 。 失 误 的 程序 会 越过 数组 的 结 
尾 ， 因 为 & 不 像 &&， 总 是 会 对 所 有 的 操作 数 进行 求 值 。 因 此 循环 的 最 
后 一 次 获取 tab 时 i 的 值 已 经 等 于 tabsize 了。 如 果 tabsize 是 tab 中 元 素 的 数 
量 ， 则 会 取 到 tab 中 不 存在 的 一 个 值 。 
































4.3 下 标 从 零 开 始 


在 很 多 语言 中 ， 有 具有 n 个 元 素 的 数组 其 元 素 的 号 码 和 它 的 下 标 是 从 1 
到 n 严 格 对 应 的 。 但 在 C 中 不 是 这 样 。 

一 个 具有 n 个 元 素 的 C 数 组 中 没有 下 标 为 n 的 元 素 ， 其 中 的 元 素 的 下 
标 是 从 0 到 jn - 1。 因 此 从 其 它 语言 转 到 C 语 言 的 程序 员 应 该 特别 小 心地 使 
用 数组 : 

int i, a[10]; 

for(i = 1; i <= 10; i++) 

a = 0; 

这 个 例子 的 目的 是 要 将 a 中 的 每 个 元 系 都 设置 为 0%， 但 没有 期 望 的 效 
果 。 因 为 for 语 句 中 的 比较 i < 100R aM Si <= 10，a 中 的 一 个 编号 为 
10 的 并 不 存在 的 元 素 被 设置 为 了 0， 这 样 内 存 中 a 后 面 的 一 个 字 被 破坏 
了 。 如 果 编 译 该 程序 的 编译 器 按照 降序 地 址 为 用 户 变 量 分 配 内 存 ， 则 a 
后 面 束 是 i。 将 i 设置 为 零 会 导致 该 循环 陷入 一 个 无 限 循环 。 




















4.4 C 并 不 总 是 转换 实 参 


下 面 的 程序 段 由 于 两 个 原因 会 失败 : 

double s; 

s = sqrt(2); 

printf("%g\n", s); 

第 一 个 原因 是 sqrtO0 需 要 一 个 double 值 作为 它 的 参数 ， 但 没有 得 到 。 
第 二 个 原因 是 它 返 回 一 个 double 值 但 没有 这 样 声名 。 改 正 的 方法 只 有 一 
A 

double s, sqrt(); 

s = sqrt(2.0); 

printf("%g\n", s); 

cC 中 有 两 个 简单 的 规则 控制 着 函数 参数 的 转换 : (1) 比 int 短 的 整 型 被 
转换 为 int; (2) 比 double 短 的 浮 点 类 型 被 转换 为 double。 上 所 有 的 其 它 值 不 
被 转换 。 确 保函 数 参数 类 型 的 正确 性 是 程序 员 的 责任 。 

因此 ， 一 个 程序 员 如 果 想 使 用 如 sqrt0 这 样 接受 一 个 double 类 型 参数 
的 函数 ， 就 必须 仅 传递 给 它 float 或 double 类 型 的 参数 。 常 数 2 是 一 个 int， 
因此 其 类 型 是 错误 的 。 

当 一 个 函数 的 值 被 用 在 表达 式 中 时 ， 其 值 会 被 自动 地 转换 为 适当 的 
类 型 。 然 而 ， 为 了 完成 这 个 上 自动 转换 ， 编 译 器 必须 知道 该 函数 实际 返回 
的 类 型 。 没 有 更 进一步 声名 的 函数 被 假设 返回 int， 因 此 声名 这 样 的 函数 
并 不 是 必须 的 。 然 而 ，sqrt0 返 回 double， 因 此 在 成 功 使 用 它 之 前 必须 要 
声名 。 

















实际 上 ，C 实 现 通常 允许 一 个 文件 包含 include 语 句 来 包含 如 sqrt0 这 
些 库 函数 的 声名 ， 但 是 对 那些 自己 写 函 数 的 程序 员 来 说 ， 编 写 声 名 也 是 

















必要 的 一 一 或 者 说 ， 对 那些 编写 非 几 的 C 程 序 的 人 来 说 是 有 必要 的 。 
这 里 有 一 个 更 加 壮观 的 例子 : 
main() { 
int 1; 
char c; 


for(i = 0; i < 5; i++) { 


scanf("%d", &c); 

printf("%d", i); 

} 

printf("\n"); 

} 

表面 上 看 ， 这 个 程序 从 标准 输入 中 读 取 五 个 整数 并 癌 标 准 输出 写 入 
0 1 2 3 4。 实 际 上 ， 它 并 不 总 是 这 么 做 。 璧 如 在 一 些 编译 器 中 ， 它 的 输 
出 为 000001234。 

为 什么 ? 因为 c 的 声名 是 char 而 不 是 int。 当 你 令 scanfO 去 读 取 一 个 整 
数 时 ， 它 需要 一 个 指向 一 个 整数 的 指针 。 但 这 里 它 得 到 的 是 一 个 字符 的 
中 针 。 但 scanfO 并 不 知道 它 没 有 得 到 它 所 需要 的 : 它 将 输入 看 作 是 一 个 
指 回 整数 的 指针 并 将 一 个 整数 存 贮 到 那里 。 由 于 整数 占用 比 字符 更 多 的 
内 存 ， 这 样 做 会 影响 到 c 附 近 的 内 存 。 

c 附 近 确 切 是 什么 是 编译 占 的 事 ; 在 这 种 情况 下 这 有 可 能 是 i 的 低 
人 位。 因此， 每 当 向 c 中 读 入 一 个 值 ，i 就 被 置 零 。 当 程序 最 后 到 达 文 件 结 
尾 时 ，scanf() 不 再 尝试 回 c 中 放 入 新 值 ， 计 可 以 正常 地 增长 ， 直 到 循环 


结束 。 

















4.5 指针 不 是 数组 


C 程 序 通 弟 将 一 个 字符 串 转 换 为 一 个 以 空 字符 结尾 的 字符 数组 。 假 
设 我 们 有 两 个 这 样 的 字符 串 s 和 t， 并 且 我 们 想 要 将 它们 连接 为 一 个 单独 
的 字符 串 r。 我 们 通常 使 用 库 函 数 strcpy0 和 strcat0) 来 完成 。 下 面 这 种 明 
显 的 方法 并 不 会 工作 : 

char *r; 

strcpy(r, s); 

strcat(r, t); 

这 是 因为 r 没 有 人 补 初始 化 为 指 问 任何 地 方 。 尽 管 r 可 能 潜在 地 表示 茶 
一 块 内 存 ， 但 这 并 不 存在 ， 直 到 你 分 配 它 。 

让 我 们 再 试 试 ， 为 ?分 配 一 些 内 存 : 

char r[ 100]; 

strcpy(r, s); 

strcat(r, t); 

AA FESPA Se Tad A SEF BAN EN a ES TAE. PER 
是 ，C 要 求 我 们 为 数组 指定 的 大 小 是 一 个 常数 ， 因 此 无 法 确定 rz 是 否 足 够 
大 。 然 而 ， 很 多 C 实 现 带 有 一 个 叫做 malloc0 的 库 函 数 ， 它 接受 一 个 数字 
并 分 配 这 么 多 的 内 存 。 通 常 还 有 一 个 函数 称 为 strlen()， 可 以 告诉 我 们 一 
个 字符 串 中 有 多 少 个 字符 因此， 我 们 可 以 写 : 

char *r, *malloc(); 

r = malloc(strlen(s) + strlen(t)); 


strcpy(r, s); 

strcat(r, t); 

然而 这 个 例子 会 因为 两 个 原因 而 失败 。 首 先 ，mallocO 可 能 会 耗 尽 
内 存 ， 而 这 个 事件 仅 通 过 静 静 地 返回 一 个 空 指针 来 表示 。 

其 次 ， 更 重要 的 是 ，mallocO 并 没有 分 配 足 够 的 内 存 。 一 个 字符 串 
是 以 一 个 空 字 符 结 束 的 。 而 strlen() 函 数 返回 其 字符 串 参 数 中 所 包含 字符 
的 数量 ， 但 不 包括 结尾 的 空 字符 。 因 此 ， 如 果 strlen(s) 是 n， 则 s 需 要 n + 
1 个 字符 来 盛 放 它 。 因 此 我 们 需要 为 r 分 配额 外 的 一 个 字符 。 再 加 上 检查 
malloc) Æ+ RRJ, RITE: 


char *r, *malloc(); 




















r = malloc(strlen(s) + strlen(t) + 1); 
if(!r) { 

complain(); 

exit(1); 

} 

strcpy(r, s); 

strcat(r, t); 


4.6 避免 提 喻 法 


提 喻 法 (Synecdoche， sin-ECK-duh-key) 是 一 种 文学 手法 ， 有 点 类 
似 于 明 喻 或 暗喻 ， 在 牛津 英文 词典 中 解释 如 下 : “a more comprehensive 
term is used for a less comprehensive or vice versa; as whole for part or part 
for whole, genus for species or species for genus, etc.( 将 全 面 的 单位 用 作 
不 全 面 的 单位 ， 或 反之 ， 如 整体 对 局 部 或 局 部 对 整体 、 一 般 对 特殊 或 特 
殊 对 一 般 ， 等 等 。 gee 
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正 将 常会 在 字符 串 中 发 生 。 例 如 : 

char *p, *q; 

p = "xyz"; 

尽管 认为 p 的 值 是 xyz 有 时 是 有 用 的 ， 但 这 并 不 是 真 的 ， 理 解 这 一 点 
非常 重要 。p 的 值 是 指向 一 个 有 四 个 字符 的 数组 中 第 0 个 元 系 的 指针 ， 这 
四 个 字符 是 x"、、'y'、'z' 和 "0'。 因 此 ， 如 果 我 们 现在 执行 : 

q= pP; 

p 和 qd 会 指向 同一 块 内存 。 内 存 中 的 字符 没有 因为 赋值 而 被 复制 。 这 
种 情况 看 起 来 是 这 样 的 : 

要 记 住 的 是 ， 复 制 一 个 指针 并 不 能 复制 它 所 指向 的 东西 。 

因此 ， 如 果 之 后 我 们 执行 : 

q[1] = 'Y;; 
n gq 所 指 同 的 内 存 包 含 字 符 串 xYz。p 也 是 ， 因 为 p 和 gq 指向 相同 的 内 
子 。 


























4.7 空 指针 不 是 空 字符 串 


将 一 个 整数 转换 为 一 个 指针 的 结果 是 实现 相关 的 (implementation- 
dependent) ， 除 了 一 个 例外 。 这 个 例外 是 常数 0， 它 可 以 保证 被 转换 为 
一 个 与 其 它 任 何 有 效 指 针 都 不 相等 的 指针 。 这 个 值 通常 类 似 这 样 定义 : 

#define NULL 0 

但 其 效果 是 相同 的 。 要 记 住 的 一 个 重要 的 事情 是 ， 当 用 0 作为 指针 
时 它 决 不 能 被 解除 引用 。 换 名 话说 ， 当 你 将 0 赋 给 一 个 指针 变量 后 ， 你 
就 不 能 访问 它 所 指 同 的 内 存 。 不 能 这 样 写 : 

if(p == (char *)0) .… 

也 不 能 这 样 写 : 

if(stremp(p, (char *)0) == 0)... 

因为 stremp0 总 是 通过 其 参数 来 查看 内 存 地 址 的 。 

如 果 p 是 一 个 空 指针 ， 这 样 写 也 是 无 效 的 : 

printf(p); 

或 

printf("%s", p); 














4.8 Ae E 


C 语 言 关 于 整数 操作 的 上 溢 或 下 滋 定 义 得 非常 明确 。 

只 要 有 一 个 操作 数 是 无 符号 的 ， 结 果 就 是 无 符号 的 ， 并 且 以 2n 为 
人 

例如 ， 假 设 a 和 b 是 两 个 非 负 整 型 变量 ， 你 希望 测试 a + bee Alito o 
一 个 明显 的 办 法 是 这 样 的 : 

if(a+b <0) 

complain(); 

通常 ， 这 是 不 会 工作 的 。 

一 旦 a + b 发 生 了 溢出 ， 对 于 结果 的 任何 赌注 都 是 没有 意义 的 。 例 
如 ， 在 茶 些 机 右上 ， 一 个 加 法 运算 会 将 一 个 内 部 寄存 器 设置 为 四 种 状 
AS: 正 、 负 、 零 或 溢出 。 ”在 这 样 的 机 器 上 ， 编 译 器 有 权 将 上 面 的 例子 
实现 为 首先 将 a 和 b 加 在 一 起 ， 然 后 检查 内 部 寄存 器 状态 是 否 为 负 。 如 果 
该 运算 洲 出 ， 内 部 寄存 器 将 处 于 洲 出 状态 ， 这 个 测试 会 失败 。 

使 这 个 特殊 的 测试 能 够 成 功 的 一 个 正确 的 方法 是 依赖 于 无 符号 算术 
的 民 好 定义 ， 即 要 在 有 符号 和 无 符号 之 间 进 行 转换 : 

if((int)((unsigned)a + (unsigned)b) < 0) 

complain(); 

4.9 移 位 运算 符 

两 个 原因 会 令 使 用 移 位 运算 符 的 人 感到 烦恼 : 

在 右 移 运 算 中 ， 空 出 的 位 是 用 0 填充 还 是 用 符号 位 填充 ? 

移 位 的 数量 允许 使 用 哪些 数 ? 

第 一 个 问题 的 答案 很 简单 ， 但 有 时 是 实现 相关 的 。 如 果 要 进行 移 位 
的 操作 数 是 无 符号 的 ， 会 移入 0。 如 果 操 作 数 是 带 符 号 的 ， 则 实现 有 权 
决定 是 移入 0 还 是 移入 符号 位 。 如 果 在 一 个 右 移 操作 中 你 很 关心 空位 ， 
那么 用 unsigned 来 声明 变量 。 这 样 你 就 有 权 假 设 空位 被 设置 为 0。 

第 二 个 问题 的 答案 同样 简单 : 如 果 符 移 位 的 数 长 度 为 n， 则 移 位 的 
数量 必须 大 于 等 于 0 并 且 严 格 地 小 于 n。 因 此 ， 在 一 次 单独 的 操作 中 不 可 
能 将 所 有 的 位 从 变量 中 移出 。 


例如 ， 如 果 一 个 int 是 32 位 ， 且 mn 是 一 个 int， 写 n << 31 和 n << 0 是 合 























YEN), (An << 32 和 n << -1 是 不 合法 的 。 

注意 ， 即 使 实现 将 符号 为 移入 空位 ， 对 一 个 带 符 号 整数 的 右 移 运 算 
和 除 以 2 的 某 次 震 也 不 是 等 价 的 。 为 了 证 明 这 一 点 ， 考 虑 (-1H) >> 1 的 值 ， 
这 是 不 可 能 为 0 的 。[ 译 注 : (-D /2 的 结果 是 0。] 


5 库 函数 


每 个 有 用 的 C 程 序 都 会 用 到 库 函 数 ， 因 为 没有 办 法 把 输入 和 输出 内 
建 到 语言 中 去 。 在 这 一 节 中 ， 我 们 将 会 看 到 一 些 广泛 使 用 的 库 函数 在 茶 
种 情况 下 会 出 现 的 一 些 非 预期 行为 。 


5.1 getc(O 返 回 整数 
考虑 下 面 的 程序 : 


#include 

main() { 

char c; 

while((c = getchar()) != EOF) 

putchar(c); 

} 

这 段 程序 看 起 来 好 像 要 将 标准 输入 复制 到 标准 输出 。 实 际 上 ， 它 并 
不 完全 会 做 这 些 。 

原因 是 c 被 声明 为 字符 而 不 是 整数 。 这 意味 着 它 将 不 能 接收 可 能 
现 的 所 有 字符 包括 EOF。 

因此 这 里 有 两 种 可 能 性 。 有 时 一 些 合法 的 输入 字符 会 导致 携带 和 
EOF 相 同 的 值 ， 有 时 义 会 使 c 无 法 存放 EOF 值 。 在 前 一 种 情况 下 ， 程 序 
E be ee es be laa 

实际 上 ， 还 存在 着 第 三 种 可 能 : 程序 会 偶然 地 正确 工作 。C 语 言 参 
考 手 册 严 格 地 定义 了 表达 式 

((c = getchar()) != EOF) 

的 结果 。 其 6.1 节 中 声明 : 

当 一 个 较 长 的 整数 被 转 换 为 一 个 较 短 的 整数 或 一 个 char 时 ， 它 会 被 
BRAAM; 超出 的 位 被 简单 地 丢弃 。 

7.14 节 声明 : 

存在 着 很 多 赋值 运算 符 ， 它 们 都 是 从 右 至 左 结合 的 。 它 们 都 需要 一 
个 左 值 作为 左 侧 的 操作 数 ， 而 赋值 表达 式 的 类 型 就 是 其 左 侧 的 操作 数 的 
类 型 。 其 值 就 是 已 经 赋 过 值 的 左 操 作 数 的 值 。 

这 两 个 条 球 的 组 合 效 果 就 是 必须 通过 丢弃 getchar() 的 结果 的 高 位 ， 
将 其 截 短 为 字符 ， 之 后 这 个 被 截 短 的 值 再 与 EOF 进 行 比较 。 作 为 这 个 比 
较 的 一 部 分 ，c 必 须 被 扩展 为 一 个 整数 ， 或 者 采取 将 左 侧 的 位 用 0 填充 ， 
或 者 适当 地 采取 符 写 扩展 。 

















然而 ， 一 些 编 译 占 并 没有 正确 地 实现 这 个 表达 式 。 它 们 确实 将 
getchar() 的 值 的 低 几 位 赋 给 c。 但 在 c 和 EOF 的 比较 中 ， 它 们 却 使 用 了 
getchar() 的 值 ! 这 样 做 的 编译 器 会 使 这 个 事例 程序 看 起 来 能 够 “正确 
Hh” LE 





5.2 绥 冲 输出 和 内 存 分 配 


当 一 个 程序 产生 输出 时 ， 能 够 立即 看 到 它 有 多 重要 ? 这 取决 于 程 
Fo 

例如 ， 终 端 上 显示 输出 并 要 求人 们 坐 在 终端 前 面 回 答 一 个 问题 ， 人 
们 能 够 看 到 输出 以 知道 该 输入 什么 就 显得 至 关 重 要 了 。 男 一 方面 ， 如 果 
输出 到 一 个 文件 中 ， 并 最 终 被 发 送 到 一 个 行 式 打印 机 ， 只 有 所 有 的 输出 
最 终 能 够 到 达 那 里 是 重要 的 。 

立即 安排 输出 的 显示 通常 比 将 其 暂时 保存 在 一 大 块 一 起 输出 要 昂贵 
得 多 。 因 此 ，C 实 现 通 常 允许 程序 员 控 制 产 生 多 少 输出 后 在 实际 地 写 出 
Alle 

这 个 控制 通常 约定 为 一 个 称 为 setbufO 的 库 函 数 。 如 果 buf 是 一 个 具 
有 适当 大 小 的 字符 数组 ， 则 

setbuf(stdout, buf); 

将 告诉 1/O 库 写 入 到 stdout 中 的 输出 要 以 buf 作 为 一 个 输出 缓冲 ， 并 且 
等 到 buf 满 了 或 程序 员 直 接 调 用 fflush0 再 实际 写 出 。 缓 冲 区 的 合适 的 大 
小 在 中 定义 为 BUFSIZ。 
因此 ， 下 面 的 程序 解释 了 通过 使 用 setbuf0 来 讲 标准 输入 复制 到 标准 

















输出 

#include 

main() { 

int C; 

char buf[BUFSIZ]; 

setbuf(stdout, buf); 

while((c = getchar()) != EOF) 

putchar(c); 

} 

不 六 的 是 ， 这 个 程序 是 错误 的 ， 因 为 一 个 细微 的 原因 。 

要 知道 毛病 出 在 哪 ， 我 们 需要 知道 缓冲 区 最 后 一 次 刷新 是 在 什么 时 
iko BR: 主 程序 完成 之 后 ， 库 将 控制 交 回 到 操作 系统 之 前 所 执行 的 清 
理 的 一 部 分 。 在 这 一 时 刻 ， 绥 冲 区 已 经 被 释放 了 ! 








有 两 种 方法 可 以 避免 这 一 问题 。 

首先 ， 使 用 静态 缓冲 区 ， 或 者 将 其 显 式 地 声明 为 静态 : 

static char buf[ BUFSIZ]; 

或 者 将 整个 声明 移 到 主 函 数 之 外 。 

另 一 种 可 能 的 方法 是 动态 地 分 配 缓冲 区 并 且 从 不 释放 它 : 

char *mallocQ); 

setbuf(stdout, malloc(BUFSIZ)); 

注意 在 后 一 种 情况 中 ， 不 必 检 查 malloc() 的 返回 值 ， 因 为 如 果 它 失 
败 了 ， 会 返回 一 个 空 指针 。 而 setbufO 可 以 接受 一 个 空 指针 作为 其 第 二 个 
an 这 将 使 得 stdout 变 成 非 缓冲 的 。 这 会 运行 得 很 慢 ， 但 它 是 可 以 运 
(THY © 











6 预 处 理 器 


运行 的 程序 并 不 是 我 们 所 写 的 程序 ， 因为 C 预 处 理 器 首先 对 其 进行 
了 转换 。 出 于 两 个 主要 原因 〈 和 很 多 次 要 原因 ) ， 预 处 理 器 为 我 们 提供 
了 一 些 简化 的 途径 。 

首先 ， 我 们 希望 可 以 通过 改变 一 个 数字 并 重新 编译 程序 来 改变 一 个 
特殊 量 〈 如 表 的 大 小 ) 的 所 有 实例 [9]。 

其 次 ， 我 们 可 能 希望 定义 一 些 东 西 ， 它 们 看 起 来 象 函数 但 没有 函数 
调用 所 需 的 运行 开销 。 例 如 ，putchar() 和 getchar0 通 常 实现 为 宏 以 避免 
对 每 一 个 字符 的 输入 输出 都 要 进行 函数 调用 。 


6.1 宏 不 是 函数 


由 于 宏 可 以 象 函数 那样 出 现 ， 有 些 程序 员 有 时 就 会 将 它们 视 为 等 价 
的 。 因 此 ， 看 下 面 的 定义 : 

#define max(a, b) ((a) > (b) ? (a) : (b)) 

注意 宏 体 中 所 有 的 括号 。 它 们 是 为 了 防止 出 现 a 和 b 是 市 有 比 > 优 先 
级 低 的 表达 式 的 情况 。 

一 个 重要 的 问题 是 ， 像 max() 这 样 定义 的 宏 每 个 操作 数 都 会 出 现 两 
次 并 且 会 被 求 值 两 次 。 因 此 ， 在 这 个 例子 中 ， 如 果 a 比 b 大 ， 则 a 就 会 补 
求 值 两 次 : 一 次 是 在 比较 的 时 候 ， 而 男 一 次 是 在 计算 max0 值 的 时 候 。 

这 不 仅 是 低 效 的 ， 还 会 友 生 错误 : 

biggest = x[0]; 

i=1; 

while(i < n) 

biggest = max(biggest, x[i++]); 

当 max0 是 一 个 真正 的 函数 时 ， 这 会 正常 地 工作 ， 但 当 max0 是 一 个 
宏 的 时 候 会 失败 。 辟 如， 假设 x[0] 是 2、x[1] 是 3、x[2] 是 1。 我 们 来 看 看 
在 第 一 次 循环 时 会 发 生 什么 。 赋 值 语句 会 被 扩展 为 : 

biggest = ((biggest) > (x[i++]) ? (biggest) : (x[i++])); 

首先 ，biggest 与 x[i++] 进 行 比较 。 由 于 i 是 1 而 x[1] 是 3， 这 个 关系 
是 “ 假 "。 其 副作用 是 ，i 增 长 到 2。 

由 于 关系 是 “ 假 ”?，x[i++] 的 值 要 赋 给 biggest。 然 而 ， 这 时 的 变 成 2 
了 ， 因 此 赋 给 biggest 的 值 是 x[2] 的 值 ， 即 1。 

避免 这 些 问题 的 方法 是 保证 max() 宏 的 参数 没有 副作用 : 

biggest = x[0]; 

for(i = 1; i < n; i++) 

biggest = max(biggest, x); 

还 有 一 个 危险 的 例子 是 混合 宏 及 其 副作用 。 这 是 来 自 UNIX 第 八 版 
的 中 putc0 宏 的 定义 : 

#define putc(x, p) (--(p)->_cnt >= 0 ? (*(p)->_ptr++ = (x)) : _flsbuf(x, 
p)) 





putcO 的 第 一 个 参数 是 一 个 要 写 入 到 文件 中 的 字符 ， 第 二 个 参数 是 
一 个 指向 一 个 表示 文件 的 内 部 数据 结构 的 指针 。 注 意 第 一 个 参数 完全 可 
以 使 用 如 郑 ++ 之 类 的 东西 ， 尽 管 它 在 宏 中 两 次 出 现 ， 但 只 会 被 求 值 一 
次 。 而 第 二 个 参数 会 被 求 值 两 次 《在 宏 体 中 ，x 出 现 了 两 次 ， 但 由 于 它 
的 两 次 出 现 分 别 在 一 个 :的 两 边 ， 因 此 在 putcO 的 一 个 实例 中 它们 之 中 有 
且 仅 有 一 个 被 求 值 ) 。 由 于 putcO 中 的 文件 参数 可 能 市 有 副作用 ， 这 偶 
尔 会 出 现 问题 。 不 过 ， 用 户 手册 文档 中 提 到 : “由 于 putcO 被 实现 为 宏 ， 
其 对 竺 stream 可 能 会 具有 副作用 。 特 别 是 putc(c， *f++) 不 能 正确 地 工 
作 。*” 但 是 putc(*c++, 内 在 这 个 实现 中 是 可 以 工作 的 。 

有 些 C 实 现 很 不 小 心 。 例 如 ， 没 有 人 能 正确 处 理 putc(*c++, 万。 另 一 
个 例子 ， 考 虑 很 多 C 库 中 出 现 的 toupper0 函 数 。 它 将 一 个 小 写字 母 转 换 
为 相应 的 大 写字 母 ， 而 其 它 字 符 不 变 。 如 果 我 们 假设 所 有 的 小 写字 母 和 
所 有 的 大 写字 母 都 是 相 邻 的 〈 大 小 写 之 间 可 能 有 所 差距 ) ， 我 们 可 以 得 
到 这 样 的 函数 : 

toupper(c) { 

if(c >= 'a' && c <= '2') 

ct+=‘A'- ‘a’; 

return C; 


} 

在 很 多 C 实 现 中 ， 为 了 减少 比 实际 计算 还 要 多 的 调用 开销 ， 通 常 将 
其 实现 为 宏 : 

#define toupper(c) ((c) >= 'a' && (c) <= 'z' ? (c) + CA' - 'a’) : (0)) 

很 多 时 候 这 确实 比 函 数 要 快 。 然 而 ， 当 你 试 着 写 toupper(sp++) 时 ， 
会 出 现 奇 怪 的 结果 。 

男 一 个 需要 注意 的 地 方 是 使 用 宏 可 能 会 产生 巨大 的 表达 式 。 例 如 ， 
继续 考虑 maxO 的 定义 : 

#define max(a, b) ((a) > (b) ? (a): (b)) 

假设 我 们 这 个 定义 来 查找 a、b、c 和 d 中 的 最 大 值 。 如 果 我 们 直接 
































max(a, max(b, max(c, d))) 
它 将 被 扩展 为 : 
((a) > (Œ) > (C > (d) ? (c) : (D) ? b) : (C) > (dD ? c) : (9) ? 


(a): (Œ) > (CO > (d) ? (c) : (d))) ? b) : (CO > (d) ? (c) : MY 
这 出 奇 的 庞大 。 我 们 可 以 通过 平衡 操作 数 来 使 它 短 一 些 : 
max(max(a, b), max(c, d)) 

这 会 得 到 : 

((((@) > (b) ? (a) : (b> (CO) > (d) ? (c) : (@) ? 

(((a) > (b) ? (a): 6) : (CO > (D ? (9 : (0) 

这 看 起 来 还 是 写 : 

biggest = a; 

if(biggest < b) biggest = b; 

if(biggest < c) biggest = c; 

if(biggest < d) biggest = d; 

比较 好 一 些 。 
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6.2 宏 不 是 类 型 定义 


宏 的 一 个 通常 的 用 途 是 保证 不 同 地 方 的 多 个 事物 具有 相同 的 类 型 : 
#define FOOTYPE struct foo 

FOOTYPE a; 

FOOTYPE b, c; 

这 人 允许 程序 员 可 以 通过 只 改变 程序 中 的 一 行 就 能 改变 a、b 和 c 的 类 
尽管 a、b 和 c 可 能 声明 在 很 远 的 不 同 地 方 。 

使 用 这 样 的 宏 定义 还 有 着 可 移植 性 的 优势 一 一 所 有 的 C 编 译 器 都 文 
很 多 C 编 译 器 并 不 文 持 另 一 种 方法 : 

typedef struct foo FOOTYPE; 

这 将 FOOTYPE 定 义 为 一 个 与 struct foo 等 价 的 新 类 型 。 

这 两 种 为 类 型 命名 的 方法 可 以 是 等 价 的 ， 但 typedef 更 灵活 一 些 。 例 
考虑 下 面 的 例子 : 


#define T1 struct foo * 





typedef struct foo * T2; 

这 两 个 定义 使 得 T1 和 T2 都 等 价 于 一 个 struct foo 的 指针 。 但 看 看 当 我 
图 在 一 行 中 声明 多 于 一 个 变量 的 时 候 会 发 生 什么 : 

T1 a, b; 

T2 c, d; 

第 一 个 声明 被 扩展 为 : 

struct foo * a, b; 

这 里 a 被 定义 为 一 个 结构 指针 ， 但 b 被 定义 为 一 个 结构 《而 不 是 指 

。 相 反 ， 第 二 个 声明 中 c 和 d 都 锐 定 义 为 指向 结构 的 指针 ， 因 为 T2 的 











行为 好 像 真正 的 类 型 一 样 。 


7 可 移植 性 缺陷 


C 被 很 多 人 实现 并 运行 在 很 多 机 器 上 。 这 也 正 是 在 一 个 地 方 写 的 C 
程序 应 该 能 够 很 容易 地 转移 到 另 一 个 编程 环境 中 去 的 原因 。 

然而 ， 由 于 有 很 多 的 实现 者 ， 它 们 并 不 和 其 他 人 交流 。 此 外 ， 不 同 
人 
些 不 同 。 

由 于 很 多 早期 的 C 实 现 都 关系 到 UNIX 操 作 系 统 ， 因 此 这 些 函 数 的 性 
质 都 是 专 于 该 系统 的 。 当 一 些 人 开始 在 其 他 系统 中 实现 C 时 ， 他 们 演 试 
使 库 的 行为 类 似 于 UNIX 系 统 中 的 行为 。 

但 他 们 并 不 总 是 能 够 成 功 。 更 有 甚 者 ， 很 多 人 从 UNIX 系 统 的 不 同 
版 本 入 手 ， 一 些 库 函 数 的 本 质 不 可 避免 地 发 生 分歧 。 今 天 ， 一 个 C 程 序 
i E 
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7.1 一 个 名 字 中 部 有 什么 ? 


一 些 C 编 译 器 将 一 个 标识 符 中 的 所 有 字符 视 为 签名 。 而 男 一 些 在 存 
储 标识 符 时 会 忽略 一 个 极限 之 外 的 所 有 字符 。C 编 译 器 产生 的 目标 程序 
同 将 要 被 加 载 器 进行 处 理 以 访问 库 中 的 子 程序 。 加 载 絮 对 于 它们 能 够 处 
理 的 名 字 通 常 应 用 自己 的 约束 。 

一 个 常见 的 加 载 器 约束 是 所 有 的 外 部 名 字 必 须 只 能 是 大 写 的 。 面 对 
这 样 的 加 载 器 约束 ，C 实 现 者 会 强制 要 求 所 有 的 外 部 名 字 都 是 大 写 的 。 
这 种 约束 在 C 语 言 参考 手册 中 第 2.1 节 由 所 摘 述 。 

一 个 标识 符 是 一 个 字符 和 数字 序列 ， 第 一 个 字符 必须 是 一 个 字母 。 
下 划 线 算 作 字母 。 大 写字 和 母 和 小 写字 母 是 不 同 的 。 只 有 前 八 个 字符 是 
签名 ， 但 可 以 使 用 更 多 的 字符 。 可 以 被 多 种 汇编 器 和 加 载 器 使 用 的 外 部 
标识 符 ， 有 着 更 多 的 限制 : 

这 里 ， 参 考 手册 中 继续 给 出 了 一 些 例子 如 有 些 实现 要 求 外 部 标识 符 
具有 单独 的 大 小 写 格式 、 或 者 少 于 八 个 字符 、 或 者 二 者 都 有 。 

正 因为 所 有 这 些 ， 在 一 个 希望 可 以 移植 的 程序 中 小 心地 选择 标识 符 
是 很 重要 的 。 为 两 个 子 程序 选择 print_fields 和 print_float 这 样 的 名 字 不 是 
个 好 办 法 。 

考虑 下 面 这 个 显著 的 函数 : 


char *Malloc(unsigned n) { 




















char *p, *malloc(); 

p = malloc(n); 

if(p == NULL) 

panic("out of memory"); 

return p; 

} 

这 个 函数 是 保证 耗 尽 内 存 而 不 会 导致 没有 检测 的 一 个 简单 的 办 法 。 
程序 员 可 以 通过 调用 Mallo0 来 代替 mallocO0。 如 果 malloc0 不 幸 失 败 ， 将 
调用 panic0) 来 显示 一 个 恰当 的 错误 消息 并 终止 程序 。 

然而 ， 考 虑 当 该 函数 用 于 一 个 忽略 大 小 号 区 别 的 系统 中 时 会 发 生 什 
么 。 这 时 ， 名 字 malloc 和 Malloc 是 等 价 的 。 换 句 话 说， 库 函 数 mallocO 被 
上 面 的 Malloc0 函 数 完全 取代 了 ， 当 调用 malloc() 时 它 调用 的 是 它 自 己 。 
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生 混乱 。 但 在 一 些 能 够 区 分 大 小 写 的 实现 中 这 个 函数 还 是 可 以 工作 的 。 





7.2 一 个 整数 有 多 大 ? 

C 为 程序 员 提 供 三 种 整数 尺寸 ， 普通 、 短 和 长 ， 还 有 字符 ， 其 行为 
像 一 个 很 小 的 整数 。C 语 言 定义 对 各 种 整数 的 大 小 不 作 任 何 保证 : 

整数 的 四 种 斥 寸 是 非 递减 的 。 

普通 整数 的 大 小 要 足够 存放 任意 的 数组 下 标 。 

字符 的 大 小 应 该 体现 特定 硬件 的 本 质 。 

许多 现代 机 器 具有 8 位 字符 ， 不 过 还 有 一 些 具 有 7 位 获 9 位 字符 。 因 
此 字符 通常 是 7、8 或 9 位 。 

长 整数 通常 至 少 32 位 ， 因 此 一 个 长 整数 可 以 用 于 表示 文件 的 大 小 。 

普通 整数 通常 至 少 16 位 ， 因 为 太 小 的 整数 会 更 多 地 限制 一 个 数组 的 
最 大 大 小 。 

短 整 数 总 是 恰好 16 位 。 

在 实践 中 这 些 都 意味 着 什么 ?最 重要 的 一 点 就 是 别 指望 能 够 使 用 任 
何 一 个 特定 的 精度 。 非 正式 情况 下 你 可 以 假设 一 个 短 整 数 或 一 个 普通 整 
数 是 16 位 的 ， 而 一 个 长 整数 是 32 位 的 ， 但 并 不 保证 总 是 会 有 这 些 大 小 。 
你 当然 可 以 用 普通 整数 来 压缩 表 大 小 和 下 标 ， 但 当 一 个 变量 必须 存放 一 
个 一 千 万 的 数字 的 时 候 呢 ? 

一 种 更 可 移植 的 做 法 是 定义 一 个 “新 的 ”类 型 : 

typedef long tenmil; 

现在 你 就 可 以 使 用 这 个 类 型 来 声明 一 个 变量 并 知道 它 的 宽度 了 ， 最 
坏 的 情况 下 ， 你 也 只 要 改变 这 个 单独 的 类 型 定义 就 可 以 使 所 有 这 些 变量 
具有 正确 的 类 型 。 




















7.3 字符 是 带 符号 的 还 是 无 符号 的 ? 


很 多 现代 计算 机 支持 8 位 字符 ， 因 此 很 多 现代 C 编 译 右 将 字符 实现 为 
人 然而 ， 并 不 是 所 有 的 编译 器 都 按照 同 将 的 方式 解释 这 些 8 位 

这 些 问 题 在 将 一 个 char 制 转换 为 一 个 更 大 的 整数 时 变 得 尤为 重要 。 
对 于 相反 的 转换 ， 其 结果 却 是 定义 良好 的 : BARA ALAM fe] HLS HE Se o 
但 一 个 编译 器 将 一 个 char 转 换 为 一 个 int 却 需要 作出 选择 : 将 char 视 为 市 
符号 量 还 是 无 符号 量 ? 如 果 是 前 者 ， 将 char 扩 展 为 int 时 要 复制 符号 位 ; 
如 果 是 后 者 ， 则 要 将 多 余 的 位 用 0 填充 。 

这 个 决定 的 结果 对 于 那些 在 处 理 字 符 时 习惯 将 高 位 置 1 的 人 来 说 非 
常 重要 。 这 决定 着 8 位 的 字符 范围 是 从 -128 到 127 还 是 从 0 到 255。 这 又 影 
啊 着 程序 员 对 哈 希 表 和 转换 表 之 类 的 东西 的 设计 。 

如 果 你 关心 一 个 字符 值 最 高 位 置 一 时 是 否 被 视 为 一 个 负数 ， 你 应 该 
显 式 地 将 它 声 明 为 unsigned ”char。 这 样 就 能 保证 在 转换 为 整数 时 是 基 0 
的 ， 而 不 像 普 通 char 变 量 那 样 在 一 些 实现 中 是 带 符号 的 而 在 男 一 些 实现 
中 是 无 符号 的 。 

另外 ， 还 有 一 种 误解 是 认为 当 c 是 一 个 字符 变量 时 ， 可 以 通过 写 
(unsigned)c 来 得 到 与 c 等 价 的 无 符号 整数 。 这 是 错误 的 ， 因 为 一 个 char 值 
在 进行 任何 操作 (包括 转换 ) 之 前 转换 为 int。 这 时 c 会 首先 转换 为 一 个 
带 符 号 整数 再 转换 为 一 个 无 符号 整数 ， 这 会 产生 奇怪 的 结 

正确 的 方法 是 写 (unsigned char)c. 









































7.4 ARNERI T AN oe OFT SAY? 


这 里 再 一 次 重复 : 一 个 关心 右 移 操作 如 何 进行 的 程序 最 好 将 所 有 待 
移 位 的 量 声明 为 无 符号 的 。 








7.5 除法 如 何 舍 入 ? 


假设 我 们 用 b 除 a 得 到 了 商 为 q 余 数 为 r: 

q=a/b; 

r=a%b; 

我 们 暂时 假设 b > 0. 

我 们 期 望 8、b、q 和 r 之 间 有 什么 关联 ? 

最 重要 的 ， 我 们 期 望 q* b +r == a， 因 为 这 是 对 余数 的 定义 。 

如 果 a 的 符号 发 生 改 变 ， 我 们 期 望 q 的 符号 也 发 生 改 变 ， 但 绝对 值 不 

我 们 希望 保证 r >= Or < b。 人 例如， 如果 余数 将 作为 一 个 哈 希 表 的 
索引 ， 它 必须 要 保证 总 是 一 个 有 效 的 索引 。 

这 三 点 清楚 地 描述 了 整数 除法 和 求 余 操作 。 不 幸 的 是 ， 它 们 不 能 后 
时 为 真 。 

考虑 3 / 2， 商 1 余 0。 这 满足 第 一 点 。 而 -3 / 2 的 值 呢 ? 根据 第 二 点 ， 
商 应 该 是 -1， 但 如 果 是 这 样 的 话 ， 余 数 必须 也 是 -1， 这 违反 了 第 三 点 。 
或 者 ， 我 们 可 以 通过 将 余数 标记 为 1 来 满足 第 三 点 ， 但 这 时 根据 第 一 点 
商 应 该 是 -2。 这 又 违反 了 第 二 点 。 

因此 C 和 其 他 任何 实现 了 整数 除法 售 入 的 语言 必须 放弃 上 述 三 个 原 
则 中 的 至 少 一 个 。 

很 多 程序 设计 语言 放弃 了 第 三 点 ， 要 求 余 数 的 符号 必须 和 被 除数 相 
同 。 这 可 以 保证 第 一 点 和 第 二 点 。 很 多 C 实 现 也 是 这 样 做 的 。 

然而 ，C 语 言 的 定义 只 保证 了 第 一 点 和 |t| < |b| 以 及 当 a >= 0 且 b > 0 时 
r >= 0。 这 比 第 二 点 或 第 三 点 的 限制 要 小 ， 实 际 上 有 些 编译 器 满足 第 二 
点 或 第 三 点 ， 但 不 太 稼 见 《〈 如 一 个 实现 可 能 总 是 同 着 距离 0 最 远 的 方 回 
BEIT BA) « 

尽管 有 些 时 候 不 需要 灵活 性 ，C 语 言 还 是 足够 可 以 让 我 们 令 除 法 完 
成 我 们 所 要 做 的 、 提 供 我 们 所 想 知 道 的 。 例 如 ， 假 设 我 们 有 一 个 数 n 表 
示 一 个 标识 符 中 的 字符 的 一 些 函 数 ， 并 且 我 们 想 通 过 除法 得 到 一 个 哈 希 
表 入 口 h， 其 中 0 <= h <= HASHSIZE。 如 果 我 们 知道 np 是 非 负 的 ， 我 们 可 
以 简单 地 写 : 

h = n % HASHSIZE: 















































的 。 





然而 ， 如 果 n 有 可 能 是 负 的 ， 这 样 写 束 不 好 了 ， 因 为 h 可 能 也 是 负 
然而 ， 我 们 知道 h > -HASHSIZE， 因 此 我 们 可 以 写 : 

h =n % HASHSIZE; 

if(n < 0) 

h += HASHSIZE; 

同样 ， 将 n 声 明 为 unsigned 也 可 以 。 





7.6 一 个 随机 数 有 多 大 ? 


这 个 尺寸 是 模糊 的 ， 还 受 库 设计 的 影响 。 在 PDP-11[10] 机 器 上 运行 
的 仅 有 的 C 实 现 中 ， 有 一 个 称 为 rand0 的 函数 可 以 返回 一 个 〈 伪 ) 随机 非 
负 整 数 。PDP-11 中 整数 长 度 包 括 符号 位 是 16 位 ， 因 此 rand0 返 回 一 个 0 到 
215-1 之 间 的 整数 。 

当 C 在 VAX-11 上 实现 时 ， 整 数 的 长 度 变 为 32 位 长 。 那 么 VAX-11 上 
的 randO) 函 数 返 回 值 范围 是 什么 呢 ? 

对 于 这 个 系统 ， 加 利 福 尼 亚 大 学 的 人 认为 rand0 的 返回 值 应 该 涵盖 
所 有 可 能 的 非 负 整数 ， 因 此 它们 的 rand0 版 本 返回 一 个 0 到 231-1 之 间 的 


aE 





而 AT&T 的 人 则 觉得 如 果 rand0 函 数 仍然 返回 一 个 0 到 215 之 间 的 值 
则 可 以 很 容易 地 将 PDP-11 中 期 望 rand0 能 够 返回 一 个 小 于 215 的 值 的 程序 
移植 到 VAX-11 上。 

因此 ， 现 在 还 很 难 写 出 不 依赖 实现 而 调用 rand0 函 数 的 程序 。 








7.7 大 小 写 转换 
toupper0 和 tolower0O 函 数 有 痢 类 似 的 历史 。 他 们 最 初 都 被 实现 为 


Mt 


#define toupper(c) ((c) + 'A' - 'a') 

#define tolower(c) ((c) + 'A' - 'a’) 

当 给 定 一 个 小 写字 母 作为 输入 时 ，toupper0 将 产生 相应 的 大 写字 
母 。tolower() 反 之 。 这 两 个 宏 都 依赖 于 实现 的 字符 集 ， 它 们 需要 所 有 的 
大 写字 母 和 对 应 的 小 写字 母 之 间 的 差别 都 是 常数 的 。 这 个 假设 对 于 
ASCI 和 EBCDIC 字 符 集 来 说 都 是 有 效 的 ， 可 能 不 是 很 危险 ， 因 为 这 些 
不 可 移植 的 宏 定 义 可 以 被 封装 到 一 个 单独 的 文件 中 并 包含 它们 。 

这 些 宏 确实 有 一 个 缺陷 ， 即 ， 当 给 定 的 东西 不 是 一 个 恰当 的 字符 ， 
它 会 返回 垃圾 。 因 此 ， 下 面 这 个 通过 使 用 这 些 宏 来 将 一 个 文件 转 为 小 写 
的 程序 是 无 法 工作 的 : 

int C; 

while((c = getchar()) != EOF) 

putchar(tolower(c)); 

我 们 必须 写 : 

int C; 

while((c = getchar()) != EOF) 

putchar(isupper(c) ? tolower(c) : c); 

了 怠 这 一 点 ，AT&T 中 的 UNIX 开 发 组 织 提醒 我 们 ，toupperO 和 


tolower() 都 是 事先 经 过 过 一 些 适当 的 参数 进行 测试 的 。 考 虑 这 样 重 写 这 些 
宏 : 











#define toupper(c) ((c) >= 'a' && (c) <= 'z' ? (c) + 'A' - 'a' : (c)) 
#define tolower(c) ((c) >= 'A' && (c) <= 'Z'? (c) +'a'-'A': (c)) 
但 要 知道 ， 这 里 c 的 三 次 出 现 都 要 被 求 值 ， 这 会 破坏 如 


toupper(*p++) 这 样 的 表达 式 。 因 此 ， 可 以 考虑 将 toupperO0 和 tolowerO) 重 
写 为 函数 。toupper0O 看 起 来 可 能 像 这 样 : 


int toupper(int c) { 
if(c >= 'a' && c <='z') 


return c + 'A' - 'a'; 

return C; 

} 

tolower() 类 似 。 

这 个 改变 融 来 更 多 的 问题 ， 每 次 使 用 这 些 函 数 的 时 候 都 会 引入 函数 
调用 开销 。 我 们 的 英雄 认为 一 些 人 可 能 不 愿意 文 付 这 些 开 销 ， 因 此 他 们 
将 这 个 宏 重 命名 为 : 

#define _toupper(c) ((c) + 'A' - 'a’) 

#define _tolower(c) ((c) + 'a' - 'A) 
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这 里 面 其 实 只 有 一 个 问题 ， 伯 克利 的 人 们 和 其 他 的 C 实 现 者 并 没有 
跟着 这 么 做 。 这 意味 着 一 个 在 AT&T 系 统 上 编写 的 使 用 了 toupper() 或 
tolower() 的 程序 ， 如 果 没 有 为 其 传递 正确 大 小 写字 母 参 数 ， 在 其 他 C 实 
现 中 可 能 不 会 正常 工作 。 

如 采 不 知道 这 些 历 史 ， 可 能 很 难 对 这 类 错误 进行 跟踪 。 

















7.8 先 释 放 ， 再 重新 分 配 


很 多 C 实 现 为 用 户 提 供 了 三 个 内 存 分 配 函 数 : malloc()、realloc0 和 
free()。 调 用 malloc(n) 返 回 一 个 指 回 有 n 个 字符 的 新 分 配 的 内 存 的 指针 ， 
这 个 指针 可 以 由 程序 员 使 用 。 给 free() 传 递 一 个 指向 由 malloc0 分 配 的 内 
存 的 指针 可 以 使 这 块 内 存 得 以 再 次 使 用 。 通 过 一 个 指 同 己 分 配 区 域 的 指 
针 和 一 个 新 的 大 小 调用 reallocO 可 以 将 这 块 内 存 扩大 或 缩小 到 新 尺寸 ， 

这 个 过 程 中 可 能 要 复制 内 存 。 

也 许 有 人 会 想 ， 真 相 真 是 有 点 微妙 啊 。 下 面 是 System V 接 口 定义 中 
出 现 的 对 reallocO 的 描述 ; 

realloc 改 变 一 个 由 ptr 指 问 的 size 个 字 节 的 块 ， 并 返回 该 块 〈 可 能 被 
的 指针 。 ”在 新 旧 尺 寸 中 比较 小 的 一 个 尺寸 之 下 的 内 容 不 会 被 改 

而 UNIX 系 统 第 七 版 的 参考 手册 中 包含 了 这 一 段 的 副本 。 此 外 ， 还 
包含 了 描述 reallocO 的 另外 一 段 : 

如 果 在 最 后 一 次 调用 malloc、realloc 或 calloc 后 释放 了 ptr 所 指向 的 
块 ，realloc 依 旧 可 以 工作 ; 因此 ，free、malloc 和 realloc 的 顺序 可 以 利用 
malloc 压 缩 存 贮 的 查找 策略 。 

因此 ， 下 面 的 代码 片段 在 UNIX 第 七 版 中 是 合法 的 : 

free (p); 

p = realloc(p, newsize); 

这 一 特性 保留 在 从 UNIX 第 七 版 衍生 出 来 的 系统 中 : 可 以 先 释 放 一 
块 存储 区 域 ， 然 后 再 重新 分 配 它 。 这 意味 着 ， 在 这 些 系 统 中 释放 的 内 存 
中 的 内 容 在 下 一 次 内 存 分 配 之 前 可 以 保证 不 变 。 因 此 ， 在 这 些 系 统 中 ， 
我 们 可 以 用 下 面 这 种 奇特 的 思想 来 释放 一 个 链表 中 的 所 有 元 素 : 

for(p = head; p != NULL; p = p->next) 

free((char *)p); 

而 不 用 担心 调用 free0 会 导致 p->next 不 可 用 。 

不 用 说 ， 这 种 技术 是 不 推荐 的 ， 因 为 不 是 所 有 C 实 现 都 能 在 内 存 被 
释放 后 将 它 的 内 容 保留 足 够 长 的 时 间 。 然 而 ， 第 七 版 的 手册 遗留 了 一 个 
未 声明 的 问题 : reallocO 的 原始 实现 实际 上 是 必须 要 先 释放 再 重新 分 配 
的 。 出 于 这 个 原因 ， 一 些 C 程 序 都 是 先 释放 内 存 再 重新 分 配 的 ， 而 当 这 
些 程序 移植 到 其 他 实现 中 时 就 会 出 现 问题 。 
































7.9 可 移植 性 问题 的 一 个 实例 

让 我 们 来 看 一 个 已 经 被 很 多 人 在 很 多 时 候 解决 了 的 问题 。 下 面 的 程 
序 带 有 两 个 参数 : 一 个 长 整数 和 一 个 函数 《的 指针 ) 。 它 将 整数 转换 位 
十 进 制 数 ， 并 用 代表 其 中 每 一 个 数字 的 字符 来 调用 给 定 的 函数 。 

void printnum(long n, void (*p)()) { 

if(n < 0) { 

(CD) 

n= -Di; 

} 

if(n >= 10) 

printnum(n / 10, p); 

(*p)(n % 10 + '0'); 

} 

这 个 程序 非常 简单 。 首 先 检 查 n 是 否 为 负数 ， 如 果 是 ， 则 打印 一 个 
符号 并 将 n 变 为 正 数 。 接 下 来 ， 测 试 是 否 n >= 10. WR, WER THE 
制 表 示 中 包含 两 个 或 更 多 个 数字 ， 因 此 我 们 递归 地 调用 printnum() 来 打 
印 除 最 后 一 个 数字 外 的 所 有 数字 。 最 后 ， 我 们 打印 最 后 一 个 数字 。 

这 个 程序 一 一 由 于 它 的 简单 一 一 具有 很 多 可 移植 性 问题 。 首 先是 将 
n 的 低位 数字 转换 成 字符 形式 的 方法 。 用 n % 10 来 获取 低位 数字 的 值 是 
好 的 ， 但 为 它 加 上 '0' 来 获得 相应 的 字符 表示 就 不 好 了 。 这 个 加 法 假设 机 
响 中 顺序 的 数字 所 对 应 的 字符 数 顺 序 的 ， 没 有 间 隅 ， 因 此 '0' + 5 和 '5' 的 
值 是 相同 的 ， 等 等 。 尽 管 这 个 假设 对 于 ASCII 和 EBCDIC 字 符 集 是 成 立 
人 





























void printnum(long n, void (*p)()) { 
if(n < 0) { 

(*p)(-'); 

n=-n; 

} 

if(n >= 10) 

printnum(n / 10, p); 


(*p)("'0123456789"[n % 10]); 


} 

另 一 个 问题 发 生 在 当 n < 0 时 。 这 时 程序 会 打印 一 个 负 号 并 将 n 设 置 
为 -n。 这 个 赋值 会 发 生 溢出 ， 因 为 在 使 用 2 的 补 码 的 机 器 上 通 帝 能够 表 
示 的 负数 比 正 数 要 多 。 例 如 ， 一 个 《长 ) 整数 有 k 位 和 一 个 附加 位 表示 
符号 ， 则 -2k 可 以 表示 而 2k 却 不 能 。 

解决 这 一 问题 有 很 多 方法 。 最 直观 的 一 种 是 将 n 赋 给 一 个 unsigned 
long 值 。 然 而 ， 一 些 C 便 一 起 可 能 没有 实现 unsigned long， 因 此 我 们 来 看 
看 没有 它 怎么 办 。 

在 第 一 个 实现 和 第 二 个 实现 的 机 器 上 ， 改 变 一 个 正 整 数 的 符号 保证 
不 会 发 生 光 出。 问题 仅 出 在 改变 一 个 负数 的 符号 时 。 因 此 ， 我 们 可 以 通 
过 避免 将 n 变 为 正 数 来 避免 这 个 问题 。 

当然 ， 一 且 我 们 打印 了 负数 的 符号 ， 我 们 就 能 够 将 负数 和 正 数 视 为 
是 一 样 的。 下 面 的 方法 就 强制 在 打印 符号 之 后 n 为 负数 ， 并 且 用 负数 值 
完成 我 们 所 有 的 算法 。 如 果 我 们 这 么 做 ， 我 们 就 必须 保证 程序 中 打印 符 
号 的 部 分 只 执行 一 次 ;一 个 简单 的 方法 是 将 这 个 程序 划分 为 两 个 函数 : 

void printnum(long n, void (*p)()) { 

if(m < 0) { 

(*p)('-'); 

printneg(n, p); 

} 

else 

printneg(-n, p); 

} 

void printneg(long n, void (*p)()) { 

if(n <= -10) 

printneg(n / 10, p); 

(*p)("0123456789"[-(n % 10)]); 

} 

printnum0O 现 在 只 检查 要 打印 的 数 是 否 为 负数 ， 如 果 是 的 话 则 打印 
一 个 符号。 否则 ， 它 以 n 的 负 绝 对 值 来 调用 printneg()。 我 们 同时 改变 了 
printneg() 的 函数 体 来 适应 n 永 远 是 负数 或 零 这 一 事实 。 























我 们 得 到 什么 ? 我 们 使 用 n / 10 和 n % 10 来 获取 mn 的 前 导数 字 和 结尾 
数字 〈 经 过 适当 的 符号 变换 ) 。 调 用 整数 除法 的 行为 在 其 中 一 个 操作 数 
为 负 的 时 候 是 实现 相关 的 。 因 此 ，n % 10 有 可 能 是 正 的 ! 这 时 ，-(n % 
10) 是 负数 ， 将 会 超出 我 们 的 数字 字符 数组 的 末尾 。 

为 了 解决 这 一 问题 ， 我 们 建立 两 个 临时 变量 来 存放 商 和 余数 。 作 完 
除法 后 ， 我 们 检查 余数 是 否 在 正确 的 范围 内 ， 如 果 不 是 的 话 则 调整 这 两 
个 变量 。printnum() 没 有 改变 ， 因 此 我 们 只 列 出 printneg(): 

void printneg(long n, void (*p)()) { 

long q; 

int r; 

if(r > 0) { 

r-= 10; 

qrt; 

} 

if(n <= -10) { 

printneg(q, p); 

} 

(*p)("'0123456789"[-r]); 


} 














8 X HE E T N Ze I) 


还 有 很 多 可 能 让 C 程 序 员 误 入 迷途 的 地 方 本 文 没有 提 到 。 如 果 你 及 
现 了 ， 请 联系 作者 。 在 以 后 的 版 本 中 它 会 被 包含 进来 ， 并 添加 一 个 表示 
感谢 的 脚注 。 

参考 

(The C Programming Language) (Kernighan and Ritchie, Prentice- 
Hall 1978) 是 最 具 权 威 的 C 闭 作 。 它 包含 了 一 个 优秀 的 教程 ， 面 癌 那 些 
熟悉 其 他 高 级 语言 程序 设计 的 人 ， 和 一 个 参考 手册 ， 简 活 地 摘 述 了 整个 
语言 。 尽 管 目 1978 年 以 来 这 门 语言 发 生 了 不 少 变 化 ， 这 本 书 对 于 很 多 主 
题 来 说 仍然 是 个 定论 。 这 本 书 同时 还 包含 了 本 文中 多 次 提 到 的 “C 语 言 参 
考 手 册 ”。 

«The C Puzzle Book) (Feuer, Prentice-Hall, 1982) 是 一 本 少见 的 
磨炼 人 们 文法 能 力 的 书 。 这 本 书 收集 了 很 多 迹 题 (和 管 案 ) ， 它 们 的 解 
决 方法 能 够 测试 读者 对 于 C 语 言 精妙 之 处 的 知识 。 

《C: A Referenct Manual》 (Harbison and Steele, Prentice Hall 
1984) 是 特意 为 实现 者 编写 的 一 本 参考 资料 。 其 他 人 也 会 发 现 它 是 特别 
有 用 的 一 一 因为 他 能 从 中 参考 细节 。 

脚注 

1， 这 本 书 是 基于 图 书 《C Traps and Pitfalls) (Addison-Wesley, 
1989, ISBN 0-201-17928-8) 的 一 个 扩充 ， 有 兴趣 的 读者 可 以 读 一 读 它 。 

2. 因为 != 的 结果 不 是 1 就 是 0。 

3. 感谢 Guy Harris 为 我 指出 这 个 问题 。 

4. Dennis Ritchie 和 Steve Johnson 同 时 向 我 指出 了 这 个 问题 。 

5. 感谢 一 位 不 知名 的 志愿 者 提出 这 个 问题 。 

6. 感谢 Richard Stevens 指 出 了 这 个 问题 。 

7. 一些 C 编 译 具 要 求 每 个 外 部 对 象 仅 有 一 个 定义 ， 但 可 以 有 多 个 声 
明 。 使 用 这 样 的 编 详 绒 时 ， 我 们 何以 很 容易 地 将 一 个 声明 放 到 一 个 包含 
文件 中 ， 并 将 其 定义 放 到 其 它 地 方 。 这 意味 着 每 个 外 部 对 象 的 类 型 将 出 
现 两 次 ， 但 这 比 出 现 多 于 两 次 要 好 。 

8 分离 函 数 参数 用 的 喜 号 不 是 逗号 运算 符 。 例 如 在 f(x， 妇 中 ，Xx 和 y 









































的 获取 顺序 是 未 定义 的 ， 但 在 g((x，y)) 中 不 是 这 样 的。 其 中 g 只 有 一 个 参 
它 的 值 是 通过 对 x 进行 求 值 、 抛 弃 这 个 值 、 再 对 y 进 行 求 值 来 确定 
Nis 

9. 预 处 理 器 还 可 以 很 容易 地 组 织 这 样 的 显 式 常量 以 能 够 方便 地 找到 
它们 。 

10. PDP-11 和 VAX-11 是 数组 设备 集团 (DEC) 的 商标 。 
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